BEES 


作为 UNIX 环境 编程 方面 的 经 典 著作 ， 由 著名 技术 专家 W. Richard Stevens 撰写 的 Advanced 
Programming in the UNIX® Environment 自 1992 年 出 版 以 来 ， 受 到 专家 和 读者 的 普遍 欢迎 。 由 
Stephen A. Rago 作为 共同 作者 ， 根 据 新 的 系统 和 规范 进行 了 更 新 ，2005 年 出 版 了 第 2 版 。2013 
年 由 Rago 更 新 到 了 第 3 版 ,涵盖 了 70 多 个 最 新 版 POSIX.1 标准 的 新 增 接口 ， 删 除了 STREAMS 
相关 接口 的 内 容 ， 并 将 使 用 的 典型 平台 更 新 为 Solaris 10、Darwin 10.8.0、FressBSD 8.0 和 Ubuntu 
12.04。 

目前 UNIX 版 本 不 断 涌现 ， 例 如 广 为 使 用 的 苹果 Mac OS X 和 iOS 使 用 开源 类 UNIX RER 
F Darwin， 谷 歌 的 Android 采用 Linux 作为 操作 系统 内 核 。 尽 管 UNIX 编程 环境 和 C 程序 设计 语 
言 的 标准 化 方面 已 经 有 不 少 工作 ， 但 系统 接口 不 断 增 加 ， 例 如 Single UNIX Specification 第 1 版 
(SUSv1) 1994 年 出 版 时 大 约 包 含 了 1170 个 接口 (也 被 称 为 Spec 1170)， 到 2010 年 发 布 第 4 版 时 
(SUSv4), 已 经 包括 1833 个 接口 。 虽 然 系统 调用 接口 和 库 函 数 可 参见 《UNIX 程序 员 手 册 》 第 2、 
3 部 分 ， 但 “手册 中 没有 给 出 实例 及 基本 原理 ， 而 这 些 正 是 本 书 所 要 讲述 的 内 容 ”( 第 1 版 前 言 )。 
本 书 精 选 了 常用 的 400 多 个 系统 调用 和 库 函 数 ， 这 些 接口 基本 是 UNIX 系统 软件 的 核心 功能 ， 涵 
盖 了 UNIX/Linux 系统 编程 的 方方面面 。 本 书 通过 简明 完整 的 例子 来 说 明 其 用 途 ， 不 仅仅 说 明了 
其 基本 用 法 ， 还 反映 了 不 同 平台 之 间 细 微 差异 ， 有 助 于 读者 对 整个 编程 环境 有 全 面 深 入 的 了 解 。 
在 翻译 本 书 的 过 程 中 ， 译 者 也 是 收益 良 多 ， 同 时 ， 一 些 经 典 的 案例 已 经 用 于 大 学 课堂 教学 和 编程 
实践 中 。 

本 书 的 第 2 章 至 第 12 章 由 同济 大 学 张 亚 英 翻 译 和 校对 ， 其 余 由 上 海 交 通 大 学 软件 学 院 戚 正 
伟 翻 译 和 校对 ， 上 海 交通 大 学 计算 机 系 尤 晋 元 教授 对 全 书 统 稿 。 本 书 第 1 版 和 第 2 版 中 译本 自 出 
版 以 来 ， 很 多 读者 对 其 提出 了 宝贵 意见 ， 在 本 版 本 中 尽量 采纳 了 这 些 意见 。 同 时 ， 我 们 的 工作 还 
得 到 上 海 交 通 大 学 软件 学 院 许 多 研究 生 《【 葛 馨 需 、 王 佳 骏 、 李 考 、 王 润泽 、 朱 新 宇 、 孙 海洋 、 
张 子 卓 、 许 欣 昊 、 马 军 、 梁 丹 ) 的 帮助 ， 在 此 一 并 表示 感谢 。 

还 要 特别 感谢 人 民 邮 电 出 版 社 编辑 杨 海 玲 在 本 书 的 编辑 、 出 版 方面 所 付出 的 辛勤 劳动 。 

我 们 希望 本 书 的 出 版 对 相关 科技 人 员 和 读者 所 有 帮助 ， 同 时 也 期 望 广 大 专家 和 读者 提出 宝贵 
意见 。 





第 2 版 序 


我 差不多 每 次 在 接受 专访 当中 , 或 是 做 技术 讲座 后 的 提问 时 间 里 , 总 会 被 问 及 这 样 一 个 问题 : 
“你 想到 过 UNIX 会 生存 这 人 么 长 时 间 吗 ? ”自然 ， 每 次 的 回答 都 是 ，“ 没 有 ， 我 们 没 想到 会 是 这 
样 。” 从 某 种 角度 说 ，UNIX 系统 已 经 伴随 了 商用 计算 行业 历史 的 大 半 ， 而 这 也 早 就 不 是 什么 新 
闻 了 。 

发 展 的 历程 错综复杂 ， 充 满 变数 。 自 20 世纪 70 年 代 初 以 来 ， 计 算 机 技术 经 历 了 沧海 桑田 般 
的 变化 , 尤其 体现 在 网 络 技术 的 普遍 应 用 、 图 形 化 的 无 所 不 在 、 个 人 计算 的 触手 可 及 ,然而 UNIX 
系统 却 奇迹 般 地 容纳 和 适应 了 所 有 这 些 变化 。 虽 然 商 业 应 用 环境 在 桌面 领域 目前 仍然 为 微软 和 英 
特 尔 两 家 公司 所 统治 ， 但 是 在 某 些 方面 已 经 从 单一 供应 商 向 多 种 来 源 转变 ， 特 别 是 近年 来 对 公共 
标准 和 免费 可 用 来 源 的 信赖 与 日 俱 增 。 

UNIX 作为 一 种 现象 而 不 单 是 商标 品牌 ， 有 幸 能 与 时 俱 进 ， 乃 至 领导 潮流 。 在 20 世纪 70— 
80 FAR, AT&T 虽 对 UNIX 的 实际 源 代码 进行 了 版 权 保护 ， 但 却 鼓 励 在 系统 的 接口 和 语言 基础 上 
进行 标准 化 的 工作 。 例如 , AT&T 发 布 了 SVID (System V Interface Definition, RA V 接口 定义 )， 
这 成 为 POSIX 及 其 后 续 工作 的 基础 。 后 来 ，UNIX 可 以 说 相当 优雅 地 适应 了 网 络 环境 ， 虽 不 那么 
轻巧 却 也 充分 地 适应 了 图 形 环境 。 再 往 后 ， 开 源 运 动 的 技术 基础 中 集成 了 UNIX 的 基本 内 核 接口 
和 许多 它 独特 的 用 户 级 工具 。 

即使 在 UNIX 软件 系统 本 身 还 是 专 有 的 时 候 ， 鼓 励 出 版 UNIX 系统 方面 的 论文 和 书籍 也 是 至 
关 重 要 的 ， 著 名 的 例子 就 是 Maurice Bach 的 《UNIX 操作 系统 设计 》 一 书 。 其 实 我 要 说 明 的 是 ， 
UNIX 长 寿 的 主要 原因 是 , 它 吸引 了 极 具 天 分 的 技术 作者 , 为 大 众 解读 它 的 优美 和 神秘 所 在 。 Brian 
Kernighan 是 其 中 之 一 ，Rich Stevens 自然 也 是 。 本 书 第 1 版 连同 Stevens 所 著 的 系列 网 络 技术 书 
籍 ， 被 公认 为 优秀 的 、 匠 心 独 具 的 名 著 ， 成 为 极其 畅销 的 作品 。 

然而 , 本 书 第 1 版 毕竟 出 版 时 间 太 早 了 , 那 时 还 没有 出 现 Linux, 源 自 伯克利 CSRG 的 UNIX 
接口 的 开源 版 本 还 没有 广 为 流 行 ， 很 多 人 的 网 络 还 在 用 串 行 调制 解 调 器 。Steve Rago 认真 仔细 地 
更 新 了 本 书 ， 以 反映 所 有 这 些 技术 进展 ， 同 时 还 考虑 到 各 种 ISO 标准 和 IEEE 标准 这 些 年 来 的 变 
化 。 因 此 ， 他 的 例子 是 最 新 的 ， 也 是 最 新 测试 过 的 。 

总 之 ， 这 是 一 本 弥 足 珍贵 的 经 典 著作 的 更 新 版 。 





Dennis Ritchie 
2005 年 3 月 于 新 泽 西 州 默 里 山 市 


LL. 





引言 


从 我 第 一 次 修订 《UNIX 环境 高 级 编程 》 一 书 以 来 已 经 快 有 8 年 了 ， 期 间 发 生 了 很 多 的 变化 。 

。 在 出 版 第 2 版 之 前 ，Open Group 完成 了 2004 版 的 Single UNIX Specification， 它 涵盖 了 两 
套 勘 误 表 的 修改 。2008 年 ，Open Group 完成 了 新 版 的 Single UNIX Specification， 它 更 新 
了 基本 定义 ， 添 加 了 新 的 接口 ， 并 且 去 除了 弃 用 的 接口 。 这 套 规范 被 称 为 2008 年 版 的 
POSIX.1， 其 中 包含 第 7 版 的 基本 规范 , 并 在 2009 年 发 行 。 2010 年 , 它 与 更 新 后 的 curses 
接口 捆绑 ， 一 起 作为 Single UNIX Specification 第 4 版 (SUSv4) 进行 再 版 。 

e 运行 在 Intel 处 理 器 上 的 Mac OS X 操作 系统 的 10.5、10.6 和 10.8 版 , 被 Open Group 认证 

为 UNIX 系统 。 

e 苹果 公司 停止 了 PowerPC 平台 上 Mac OS X 的 开发 。 在 10.6 RITHM (Snow Leopard) 之 
后 只 针对 x86 平台 发 布 了 新 的 操作 系统 版 本 。 

。 Solaris 操作 系统 以 开源 的 形式 发 布 ， 试 图 与 FreeBSD. Linux 和 Mac OS X 遵循 的 开源 模 
式 在 声望 上 一 争 高 下 。 在 2010 年 ，Oracle 收购 了 Sun Microsystems 之 后 ，OpenSolaris 的 
开发 被 终止 。 作 为 替代 ，Solaris 社区 组 建 了 Illumos 项 目 来 继续 基于 OpenSolaris 的 开源 
开发 。 更 多 详细 的 信息 可 以 从 http://www.illumos.org 获得 。 

。 2011 年 ,C 语言 标准 被 更 新 , 但 是 因为 系统 并 未 能 跟 上 其 变化 , 本 书 中 依然 参照 1999 版 。 

最 重要 的 是 ， 在 第 2 版 中 使 用 的 平台 已 经 过 时 了 。 本 书 这 一 版 中 涉及 以 下 平台 。 

(1) FreeBSD 8.0， 前 身 是 加 州 大 学 伯克利 分 校 计算 机 系统 研究 组 发 布 的 4.4BSD 系统 ， 运 行 
在 32 位 Intel Pentium 处 理 器 上 。 

(2) Linux 3.2.0 (Ubuntu 12.04 发 布 版 ) ， 这 是 一 个 免费 的 类 UNIX 操作 系统 ， 运 行 在 64 位 
的 Intel Core iS 处 理 器 上 。 

(3) Apple Mac OS X 10.6.8 A (Darwin 10.8.0) , i247 ZE 64 位 Intel Core2 Duo 处 理 器 上 (Darwin 
基于 FreeBSD 和 Mach). RFA PowerPC 平台 转向 Intel 平台 ， 是 因为 最 新 版 的 Mac OS X 不 
再 支持 PowerPC 平台 。 这 次 选择 带 来 的 缺点 是 涉及 的 处 理 器 倾斜 问 了 Intel, 而 当 讨论 到 异 构 性 问 
题 时 ， 涉 及 的 处 理 器 如 果 能 在 字 节 序 和 整数 大 小 等 方面 有 不 同 的 性 质 将 是 很 有 好 处 的 。 

(4) Solaris 10, Sun Microsystems 〈 现 在 的 Oracle) 的 System V Release 4 的 派生 系统 ， 运 行 
在 64 位 UltraSPARC Ili 处 理 器 上 。 


与 第 2 版 的 不 同 


最 大 的 变化 之 一 是 POSIX.1-2008 中 的 Single UNIX Specification 弃 用 了 一 些 STREAMS 相关 
接口 。 这 是 准备 在 该 标准 的 未 来 版 本 中 去 掉 全 部 这 些 接口 过 程 的 第 一 步 。 因 此 ， 我 已 经 不 情愿 地 


= 
ml 


在 这 一 版 中 删除 了 STREAMS 的 内 容 。 这 是 一 个 不 幸 的 变化 ， 因 为 STREAMS 接口 为 socket 接口 
提供 了 一 个 很 好 的 对 照 ， 并 且 在 很 多 方面 更 为 灵活 。 不 可 否认， 当 谈 论 到 STREAMS 时 我 并 非 绝 
对 公正 ， 但 是 毫 无 疑问 的 是 ， 在 现 有 系统 中 它 的 分 量 已 经 减轻 。 

e Linux 基础 系统 中 未 包含 STREAMS， 虽 然 添加 该 功能 的 包 (Lis 和 OpenSS7) 是 可 用 的 。 

e 虽然 Solaris 10 中 包含 了 STREAMS, {E Æ Solaris 11 的 socket 实现 并 没有 构建 在 STREAMS 

UE. 

。 MacOSX 不 包含 STREAMS x $$. 

e FreeBSD 不 包含 STREAMS 支持 (也 从 未 包含 过 )。 

随 着 STREAMS 相关 内 容 的 去 除 ， 新 的 主题 变 得 有 机 会 替代 它 ， 例 如 POSIX 异步 VO. 

在 本 书 第 2 版 中 ，Linux 版 本 是 基于 2.4 版 的 。 在 这 次 的 版 本 中 ， 我 们 已 经 更 新 到 了 3.2 版 。 
两 个 版 本 的 最 大 不 同 之 一 是 线程 系统 。 在 Linux 2.4 和 Linux 2.6 之 间 ， 线 程 的 实现 变 为 Native 
POSIX Thread Library (NPTL). NPTL 使 得 Linux 线程 的 行为 与 其 他 系统 的 线程 更 加 相似 。 

总 的 来 说 , 这 次 的 版 本 涵盖 了 超过 70 个 新 的 接口 , 包括 处 理 异 步 VO. 自 旋 锁 、 屏 障 和 POSIX 
信号 量 等 接口 。 除 了 一 些 普遍 使 用 的 接口 被 保留 ， 大 多 数 弃 用 的 接口 均 被 删除 。 


致谢 


许多 读者 为 第 2 版 寄 来 了 评论 和 错误 报告 。 我 很 感谢 他 们 提高 了 第 2 版 的 准确 性 。 下 面 提 及 
的 各 位 是 最 早 提出 建议 或 者 指出 错误 的 , Seth Arnold. Luke Bakken. Rick Ballard. Johannes Bittner. 
David Bronder、Vlad Buslov. Peter Butler. Yuching Chen. Mike Cheng. Jim Collins. Bob Cousins. 
Will Dennis. Thomas Dickey. Loic Domaigné. Igor Fuksman. Alex Gezerlis. M. Scott Gordon. 
Timothy Goya. Tony Graham. Michael Hobgood. Michael Kerrisk、 Youngho Kwon. Richard Li, 
Xueke Liu, Yun Long. Dan McGregor. Dylan McNamee. Greg Miller. Simon Morgan. Harry Newton. 
Jim Oldfield. Scott Parish. Zvezdan Petkovic. David Reiss. Konstantinos Sakoutis. David Smoot, 
David Somers. Andriy Tkachuk, Nathan Weeks. Florian Weimer, Qingyang Xu 和 Michael Zalokar. 

技术 审 校 者 也 提高 了 内 容 的 准确 性 ， 感 谢 Steve Albert. Bogdan Barbu 和 Robert Day。 特 别 感 
W Geoff Clare 和 Andrew Josey 为 Single UNIX Specification 的 升华 和 第 2 章 的 准确 性 提供 了 帮助 。 
另外 ， 感 谢 Ken Thompson 对 历史 问题 做 出 了 解答 。 

我 得 再 一 次 说 ， 与 Addison-Wesley 的 工作 人 员 的 合作 非常 愉快 。 感 谢 Kim Boedigheimer、 
Romny French、John Fuller、Jessica Goldstein、Julie Nahil 和 Debra Williams-Cauley， 此 外 ， 感 谢 
Jill Hobbs 在 这 段 时 间 提 供 了 她 的 专业 审 稿 能 力 。 

最 后 ， 感 谢 我 的 家 人 对 我 在 这 次 再 版 上 花费 了 如 此 多 时 间 给 予 的 理解 。 

和 以 前 一 样 ， 书 中 实例 的 源码 可 以 从 www.apuebook.com 上 获得 ,我 非常 欢迎 读者 发 来 邮件 ， 
发 表 评 论 ， 提 出 建议 ， 订 正 错 误 。 


Stephen A. Rago 
sar@apuebook.com 


2013 年 1 月 于 新 泽 西 州 沃 伦 市 
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引言 


我 与 Rich Stevens 最 早 是 通过 电子 邮件 开始 交往 的 ， 当 时 我 发 邮件 报告 他 的 第 一 本 书 《UNIX 
网 络 编程 》 的 一 个 排版 错误 。 他 回信 开玩笑 说 我 是 第 一 个 给 他 发 这 本 书 勘误 的 人 。 到 他 1999 年 
故去 之 前 ， 我 们 会 时 不 时 地 通 一 些 邮 件 ， 一般 都 是 在 有 了 问题 认为 对 方 能 解答 的 时 候 。 我 们 在 
USENIX 会 议 期 间 多 次 相 见 ， 并 共 进 晚餐 ，Rich 在 会 议 中 给 大 家 做 技术 培训 。 

Rich Stevens 真是 个 益友 , 行为 举止 很 有 绅士 风度 。 我 在 1993 年 号 《UNIX 系统 V 网 络 编程 》 
时 ， 试 图 把 书写 成 他 的 《UNIX 网 络 编程 》 的 系统 V 版 。Rich 高 兴 地 为 我 审阅 了 好 几 章 ， 并 不 把 
我 当成 竞争 对 手 ， 而 是 当 作 一 起 写 书 的 同事 。 我 们 曾 多 次 谈 到 要 合作 给 他 的 《TCP/IP 详解 》 写 个 
STREAMS 版 天 若 有 情 , 我 们 或 许 已 经 完成 了 这 个 心愿 。 然而 , Rich 已 经 驾 鹤 西 去 ,修订 《UNIX 
环境 高 级 编程 》 就 成 为 我 眼 他 一 起 写 书 的 最 易 实 现 的 方式 。 

当 Addison-Wesley 公司 的 编辑 找到 我 说 想 修订 Rich 的 这 本 书 时 ， 我 第 一 反应 是 这 本 书 没有 
多 少 要 改 的 。 尽 管 13 年 过 去 了 ，Rich 的 书 还 是 妖 然 屹立 。 但 是 ， 与 当初 本 书 出 版 的 时 候 相 比 ， 
今日 的 UNIX 行业 已 经 有 了 巨大 的 变化 。 


。 系统 V 的 各 个 变种 渐渐 被 Linux 所 取代 。 原 来 生产 硬件 配 以 各 自 的 UNIX 版 本 的 几 个 主 - 


要 厂商 ， 要 么 提供 了 Linux 的 移植 版 本 ， 要 么 宣布 支持 Linux。Solaris 可 能 算是 硕果 仅 存 
的 占有 一 定 市 场 份额 的 UNIX 系统 V 版 本 4 HERT. 
© 加 州 大 学 伯克利 分 校 的 CSRG (计算 机 科学 研究 组 ) 在 发 布 了 4.4BSD 之 后 ， 已 经 决定 不 
再 开发 UNIX 操作 系统 ， 只 有 几 个 志愿 者 小 组 还 维护 着 一 些 可 公开 获得 的 版 本 。 
e Linux 得 到 数 以 千 计 的 志愿 者 的 支持 , 它 的 引入 使 任何 一 个 拥有 计算 机 的 人 都 能 运行 类 似 
于 UNIX 系统 的 操作 系统 ， 并 且 可 以 免费 获得 源 代码 支持 哪怕 最 新 的 硬件 设备 。 在 已 经 
存在 几 种 免费 BSD 版 本 的 情况 下 ，Linux 的 成 功 确实 是 个 奇迹 。 
。 苹果 公司 作为 一 个 富有 创新 精神 的 公司 ， 已 经 放弃 了 老 的 Mac 操作 系统 ， 取 而 代 之 的 是 
一 个 在 Mach 和 FreeBSD 基础 上 开发 的 新 系统 。 
因此 ， 我 已 经 努力 更 新 本 书 中 的 内 容 ， 以 反映 这 4 种 平台 。 
在 Rich 1992 年 出 版 了 《UNIX 环境 高 级 编程 》 之 后 ， 我 扔 掉 了 手头 几乎 所 有 的 UNIX 程序 员 
手册 。 这 些 年 来 ， 我 桌 上 最 常 摆 放 的 就 是 两 本 书 ， 一 本 是 字典 ， 另 一 本 就 是 《UNIX 环境 高 级 编 
程 》。 我 希望 读者 也 能 认为 本 修订 版 一 样 有 用 。 


对 第 1 版 的 改动 


Rich 的 书 依然 屹立 ， 我 试图 不 去 改动 他 这 本 书 原来 的 风格 。 但 是 13 年 间 世 事 兴 衰 ， 尤 其 是 
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影响 UNIX 编程 接口 的 有 关 标 准 变化 很 大 。 

我 依据 标准 化 组 织 的 标准 ， 更 新 了 全 书 相 关 的 接口 方面 的 内 容 。 第 2 章 改动 较 大 ， 因 为 它 主 
要 是 讨论 标准 的 。 本 书 第 1 版 是 根据 POSIX.1 标准 的 1990 年 版 号 的 ， 本 修订 版 依据 2001 年 版 的 
新 标准 ， 内 容 要 丰富 很 多 。1990 年 ISO 的 C 标准 在 1999 年 也 更 新 了 ， 有 些 改动 影响 到 POSIX.1 
标准 中 的 接口 。 

目前 的 POSIX.1 规范 涵盖 了 更 多 的 接口 。Open Group (ARR X/Open) 发 布 的 “Single UNIX 
Specification” 的 基本 规范 现在 已 经 并 入 POSIX.1, BAAS TILA 1003.1 标准 和 另外 几 个 标准 草 
案 ， 原 来 这 些 标准 是 分 开 出 版 的 。 
| 我 也 相应 地 增加 了 些 章节 ， 讨 论 新 主题 。 线 程 和 多 线程 编程 是 相当 重要 的 概念 ， 因 为 它们 为 

程序 员 处 理 并 发 和 异步 提供 了 更 清楚 的 方式 。 

套 接 字 接口 现在 也 是 POSIX.1 的 一 部 分 了 。 它 为 进程 间 通 信 (IPC》 提 供 了 单一 的 接口 ， 而 
不 考虑 进程 的 位 置 。 它 成 为 IPC 章节 的 自然 扩展 。 

REET POSIX. 中 的 大 部 分 实时 接口 。 这 些 内 容 最 好 是 在 一 本 专门 讲述 实时 编程 的 书 中 介 
绍 。 参 考 文献 里 有 一 本 这 方面 的 书 。 

我 把 最 后 面 几 章 的 案例 研究 也 更 新 了 ， 用 了 更 接近 现实 的 例子 。 例 如 ， 现 在 很 少 有 系统 通过 
串口 或 并 口 连 接 PostScript 打印 机 了 ， 多 数 PostScript 打印 机 是 通过 网 络 连接 的 ， 所 以 我 对 
PostScript 打印 机 通信 的 例子 做 了 修改 。 

有 关 调 制 解 调 器 通信 的 那 一 章 如 今 已 经 不 太 适 用 了 。 原 始 材 料 我 们 保留 在 本 书 网 站 上 ， 有 两 
种 格式 ，PostScript Chttp//www.apuebook.convlostchapter/modem.ps) 和 PDF (http://www. apuebook.com/ 
lostchapter/modem.pdf) . 

书 中 实例 的 源 代码 也 可 以 从 www.apuebook.com 上 获得 。 多 数 实 例 已 经 在 下 述 4 种 平台 上 运 
XT. 

(1) FreeBSD 5.2.1， 是 加 州 大 学 伯克利 分 校 CSRG 的 44BSD 的 一 个 变种 ， 在 英特尔 奔腾 处 
理 器 上 运行 。 

(2) Linux 2.4.22 (Mandrake 9.2 发 布 ) ， 是 一 个 免费 的 类 UNIX 操作 系统 ， 运 行 于 英特尔 奔 
腾 处 理 器 上 。 

(3) Solaris 9， 是 Sun 公司 系统 V 版 本 4 的 变种 ， 运 行 于 64 位 的 UltraSPARC Iti 处 理 器 上 。 

(4) Darwin 7.4.0， 是 基于 FreeBSD 和 Mach 的 操作 系统 环境 ， 也 是 Apple Mac OS X 10.3 版 
本 的 核心 ， 运 行 于 PowerPC 处 理 器 上 。 


致谢 


首先 要 感谢 Rich Stevens 独立 创作 了 本 书 第 1 版 ， 它 立即 成 为 一 本 经 典 著作 。 

没有 家 人 的 支持 ， 我 不 可 能 修订 此 书 。 他 们 容忍 我 满 屋子 散落 稿 纸 〈 比 平常 更 甚 ) ， 霜 占 了 
家 里 的 好 几 台 机 器 ， 成 天 埋头 于 电脑 屏幕 前 。 我 的 妻子 Jeanne 甚至 亲自 动手 帮 我 在 一 台 测 试 的 机 
器 上 安装 了 Linux. 

多 名 技术 审 校 者 提出 了 很 多 改进 意见 ， 以 确保 内 容 准确 。 我 非常 感谢 David Bausum. David 
Boreham. Keith Bostic. Mark Ellis. Phil Howard. Andrew Josey. Mukesh Kacker, Brian Kernighan, 
Bengt Kleberg, Ben Kuperman, Eric Raymond 和 Andy Rudoff. 

我 还 要 谢谢 Andy Rudoff 给 我 解答 有 关 Solaris 的 问题 ， 谢 谢 Dennis Ritchie 不 惜 花 时 间 从 故 
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纸 堆 中 为 我 寻找 有 关 历 史 方 面 问 题 的 答案 。 再 次 谢谢 Addison-Wesley 公司 的 员工 ， 与 他 们 合作 令 
人 愉快 ， 谢 谢 Tyrrell Albaugh. Mary Franz. John Fuller. Karen Gettman、Jessica Goldstein. Noreen 
Regina 和 John Wait。 特 别 感 谢 Evelyn Pyle 细致 地 编辑 了 本 书 。 

就 像 Rich 曾经 做 到 的 那样 ， 我 非常 欢迎 读者 发 来 邮件 ， 发 表 评 论 ， 提 出 建议 ， 订 正 错 误 。 


Stephen A. Rago 
sar@apuebook.com 
2005 年 4 月 于 新 泽 西 州 沃 伦 市 
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引言 


本 书 描述 了 UNIX 系统 的 程序 设计 接口 一 一 系统 调用 接口 和 标准 C. 库 提供 的 很 多 函数 。 本 书 
针对 的 是 所 有 的 程序 员 。 

与 大 多 数 操作 系统 一 样 ，UNIX 为 程序 运行 提供 了 大 量 的 服务 一 一 打开 文件 、 读 文件 、 启 动 
一 个 新 程序 、 分 配 存 储 区 以 及 获得 当前 时 间 等 。 这 些 服务 被 称 为 系统 调用 接口 (system call 
interface)。 另 外 ， 标 准 C 库 提供 了 大 量 广 泛 用 于 C 程序 中 的 函数 〈 格 式 化 输出 变量 的 值 、 比 较 两 
个 字符 串 等 )。 

系统 调用 接口 和 库 函 数 可 参见 《UNIX 程序 员 手 册 》 第 2、3 部 分 。 本 书 不 是 这 些 内 容 的 重复 。 
手册 中 没有 给 出 实例 及 基本 原理 ， 而 这 些 则 正 是 本 书 所 要 讲述 的 内 容 。 


UNIX 标准 


20 世纪 80 年 代 出 现 了 各 种 版 本 的 UNIX, 20 世纪 80 年 代 后 期 ， 人们 在 此 基础 上 制定 了 数 个 
国际 标准 ， 包 括 C 程序 设计 语言 的 ANSI 标准 、IEEE POSIX 标准 系列 (还 在 制定 中 )、X/Open 
可 移植 性 指南 。 ; 

本 书 也 介绍 了 这 些 标准 ,但 是 并 不 只 是 说 明 标准 本 身 ， 而 是 着 重 说 明 它们 与 应 用 广泛 的 些 
实现 (主要 指 SVR4 以 及 即将 发 布 的 4.4BSD) 之 间 的 关系 。 这 是 一 种 贴近 现实 世界 的 描述 ， 而 这 
正 是 标准 本 身 以 及 仅 描述 标准 的 文献 所 缺少 的 。 


本 书 的 组 织 


本 书 分 为 以 下 6 个 部 分 。 

(1) Xt UNIX 程序 设计 基本 概念 和 术语 的 简要 描述 (第 1 章 )， 以 及 对 各 种 UNIX 标准 化 工 
作 和 不 同 UNIX 实现 的 讨论 (第 2 章 )。 

(2) UO 一 一 不 带 缓存 的 VO (第 3 章 )、 文 件 和 目录 (第 4 章 )、 标 准 IO PE CB 5 360 和 标 
准 系统 数据 文件 (第 6 章 )。 

(3) 进程 一 UNIX 进程 的 环境 (第 7 章 )、 进 程控 制 〈 第 8 章 )、 进 程 之 间 的 关系 〈 第 9 章 ) 
和 信号 〈 第 10 章 )。 

(4) 更 多 的 LO 一 一 终端 VO (第 11 章 )、 高 级 IO CB 12 章 ) 和 守护 进程 (第 13 章 )。 

(5) IPC 一 一 进程 间 通 信 (第 14 章 和 第 15 章 )。 

(6) 实例 一 一 一 个 数据 库 的 函数 库 (第 16 章 )、 与 PostScript 打印 机 的 通信 (第 17 章 )、 调 
制 解 调 器 拨号 程序 (第 18 章 ) 和 使 用 伪 终 端 (第 19 XD. 
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WAX C 语言 较 熟 悉 并 具有 某 些 应 用 UNIX 的 经 验 ， 对 学 习 本 书 将 非常 有 益 ， 但 是 并 不 要 求 
读者 必须 具有 UNIX 编程 经 验 。 本 书面 向 的 读者 主要 是 : 熟悉 UNIX 的 程序 员 ， 以 及 熟悉 其 他 某 
个 操作 系统 且 希 望 了 解 大 多 数 UNIX 系统 提供 的 各 种 服务 细节 的 程序 员 。 


本 书 中 的 实例 


本 书包 含 了 大 量 实例 一 一 大 约 10 000 行 源 代码 。 所 有 实例 都 用 ANSI C 语言 编写 。 在 阅读 本 
书 时 ， 建 议 准备 一 本 你 所 使 用 的 UNIX 系统 的 《UNIX 程序 员 手 册 》， 在 细节 方面 有 时 需要 参考 该 
手册 。 

几乎 对 于 每 一 个 函数 和 系统 调用 ， 本 书 都 用 一 个 小 的 完整 的 程序 进行 了 演示 。 这 可 以 让 读者 
清楚 地 了 解 它们 的 用 法 ， 包 括 参 数 和 返回 值 等 。 有 些小 程序 还 不 足以 说 明 库 函数 和 系统 调用 的 复 
杂 功 能 和 应 用 技巧 ， 所 以 书 中 还 包含 了 一 些 较 大 的 实例 CLR 16 章 至 第 19 章 )。 

所 有 实例 的 源 代码 文件 都 可 在 因特网 上 用 匿名 fip 从 因特网 主机 ftp.uunet 的 published/ 
books/stevens. advprog.tar.Z 文件 下 载 。 读 者 可 以 在 自己 的 机 器 上 修改 并 运行 这 些 源 代 码 。 


用 于 测试 实例 的 系统 


遗憾 的 是 ， 所 有 的 操作 系统 都 在 不 断 变更 ，UNIX 也 不 例外 。 下 图 给 出 了 系统 V 和 4.xBSD 
最 近 的 进展 情况 。 


4.3+BSD 


43BSD 4.3BSD Tahoe 4.3BSD Reno 44BSD ? 
| BSD Net 1 BSD Net 2 | 
l io + 198  ! 198  ' 1989 . | | 1989 i 1990 A 1991 1997 
4 1 I 4 
SVR3.0 SVR3.1 SVR32 | | ^— SVRA | 
XPG3 ANSI C POSIX.1 


4.xBSD 是 由 加 州 大 学 伯克利 分 校 CSRG 开发 的 。 该 小 组 还 发 布 了 BSD Net] 和 BSD Net2 hk, 
其 公开 的 源 代码 源 自 4.xBSD 系统 。SVRx 表示 AT&T 的 系统 V 第 x 版 。XPG3 指 X/Open 可 移植 
性 指南 的 第 3 个 发 行 版 。ANSIC 是 C HAA ANSI 标准 。POSIX.1 Æ IEEE 和 ISO 的 类 UNIX X 
统 接口 标准 。2.2 节 和 2.3 节 将 对 这 些 标准 和 不 同 版 本 之 间 的 差别 做 更 多 的 说 明 。 
| ”本 书 中 用 4.3+BSD 表示 源 自 伯克利 的 介 于 BSD Net2 和 4.4BSD 之 间 的 UNIX 系统 。 
”在 本 书写 作 时 ，4.4BSD 尚未 发 布 ， 所 以 还 不 能 称 之 为 4.4BSD。 为 了 用 一 个 简单 的 名 字 来 引 
| 用 该 系统 ， 故 使 用 4.3+BSD. 
本 书 中 的 大 多 数 实例 曾 在 下 面 4 种 UNIX 系统 上 运行 过 。 
(D UH 公司 (UHC) 的 UNIX 系统 V/386 R4.0.2 Cvanilla SVR4)， 运 行 于 Intel 80386 处 理 
a8 L. 
(2) 加 州 大 学 伯克利 分 校 CSRG 的 4.3+BSD， 运 行 于 惠普 工作 站 上 。 
(OD 伯克利 软件 设计 公司 的 BSD/386 (是 BSD Net2 的 变种 )， 运 行 于 Intel 80386 处 理 器 上 。 
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该 系统 与 4.3+BSD 几乎 相同 。 

(4) Sun 公司 的 SunOS 4.1.1 和 4.1.2〔 该 系统 与 伯克利 系统 有 很 深 的 渊源 ， 但 也 包含 了 许多 
系统 V 的 特性 )， 运 行 于 SPARCstation SLC E. 

本 书 还 提供 了 许多 对 系统 进行 的 时 间 测 试 ， 并 注 明 了 用 于 测试 的 实际 系统 。 


致谢 


在 过 去 的 一 年 半 中 ， 家 人 给 予 了 我 大 力 支持 和 爱 ， 因 为 写 书 我 们 失去 了 很 多 快乐 的 周末 ， 我 
深 感 欢 妆 。 写 书 从 许多 方面 影响 了 整个 家 庭 。 谢 谢 Sally. Bill. Ellen 和 David. 

我 要 特别 感谢 Brian Kemighan 对 我 写作 此 书 的 帮助 。 他 审阅 了 全 部 书稿 ， 不 但 提出 了 大 量 深 
入 细致 的 审 稿 意见 ， 还 对 更 好 的 行文 风格 给 出 了 恰当 的 建议 ， 但 愿 我 能 够 在 最 终 成 稿 中 已 经 加 以 
体现 。Steve Rago 也 成 为 了 我 的 创作 源泉 ， 不 但 审阅 了 全 部 书稿 ， 还 为 我 解答 了 有 关系 统 V 的 许 
多 技术 细节 和 历史 问题 。 还 要 感谢 Addison-Wesley 公司 邀请 的 其 他 技术 审 校 者 ， 他 们 对 书稿 的 各 
个 部 分 提出 了 很 有 价值 的 意见 , 他 们 是 Maury Bach. Mark Ellis. Jeff Gitlin, Peter Honeyman. John 
Linderman. Doug Mcllroy. Evi Nemeth. Craig Patridge. Dave Presotto. Gary Wilson. Gary Wright. 

感谢 加 州 大 学 伯克利 分 校 CSRG 的 Keith Bostic 和 Kirk McKusick 给 了 我 一 个 账号 ， 可 在 最 新 
的 BSD 系统 上 测试 书 中 实例 (还 要 感谢 Peter Salus). UHC 的 Sam Nataros 和 Joachim Sacksen 给 我 
提供 了 一 份 SVR4， 用 来 测试 书 中 例子 。Trent Hein 则 帮助 我 获得 BSD/386 的 alpha 和 beta 版 。 

其 他 朋友 在 过 去 这 些 年 以 各 种 方式 提供 了 帮助 ,看 似 不 大 , 却 非常 重要 。 他 们 是 Paul Lucchina、 
Joe Godsil Jim Hogue, Ed Tankus 和 Gary Wright. 本 书 的 编辑 是 Addison-Wesley 公司 的 John Wait, 
他 自始至终 是 我 的 忠实 朋友 。 我 不 断 地 延期 交 稿 ， 写 作 篇 幅 也 一 再 超过 计划 ， 他 从 不 抱 急 。 特 别 
还 要 感谢 美国 国家 光学 天 文 台 CNOAO), WHE Sidney Wolff. Richard Wolff 和 Steve Grandi, 
为 我 提供 准确 的 计算 机 时 间 。 

真正 的 UNIX 图 书 应 该 用 troff 写成 ， 本 书 也 遵循 了 这 一 优秀 传统 。 最 终 清 样 是 作者 用 James 
Clark 写 的 groff 软件 包 做 出 来 的 。 非常 感 谢 James Clark 提供 了 这 个 优异 的 写作 软件 , 并 迅速 地 修 
正 其 中 所 发 现 的 bug。 也 许 有 一 天 我 会 最 终 弄 清楚 troff 软件 做 脚注 的 技巧 。 

我 十 分 欢迎 读者 发 来 电子 邮件 ， 发 表 评 论 ， 提 出 建议 ， 订 正 错误 。 


W. Richard Stevens 
rstevens@kohala.com 
http://www.kohala.com/~rstevens 
1992 年 4 月 于 亚利桑那 州 塔 元 森 市 


UNIX 基础 知识 





1.4 引言 


所 有 操作 系统 都 为 它们 所 运行 的 程序 提供 服务 。 典 型 的 服务 包括 : 执行 新 程序 、 打 开 文 件 、 读 
文件 、 分 配 存 储 区 以 及 获得 当前 时 间 等 ， 本 书 集中 阐述 不 同 版 本 的 UNIX 操作 系统 所 提供 的 服务 。 

想 要 按 严格 的 先后 顺序 介绍 UNIX, 而 不 超前 引用 尚未 介绍 过 的 术语 , 这 几乎 是 不 可 能 的 (可 
能 也 会 令 人 厌烦 )。 本 章 从 程序 员 的 角度 快速 浏览 UNIX, 对 书 中 引用 的 一 些 术 语 和 概念 进行 简要 
的 说 明 并 给 出 实例 。 在 以 后 各 章 中 ， 将 对 这 些 概念 做 更 详细 的 说 明 。 对 于 初 涉 UNIX 环境 的 程序 
员 ， 本 章 还 简要 介绍 了 UNIX 提供 的 各 种 服务 。 


1.2 UNIX 体系 结构 


从 严格 意义 上 说 , 可 将 操作 系统 定义 为 一 种 软件 , 它 控制 计算 机 硬件 资源 , 提供 程序 运行 环境 。 
我 们 通常 将 这 种 软件 称 为 内 核 〈‘kemel)， 因 为 它 相 对 较 小 ， 
而 且 位 于 环境 的 核心 。 图 1-1 显示 了 UNIX 系统 的 体系 结构 。 

内 核 的 接口 被 称 为 系统 调用 (system call, 图 1-1 中 的 阴 
影 部 分 )。 公 用 函数 库 构 建 在 系统 调用 接口 之 土 ， 应 用 程序 
既 可 使 用 公用 函数 库 ， 也 可 使 用 系统 调用 。( 我 们 将 在 1.11 
节 对 系统 调用 和 库 函 数 做 更 多 说 明 。) shell 是 一 个 特殊 的 应 
用 程序 ， 为 运行 其 他 应 用 程序 提供 了 一 个 接口 。 

从 广义 上 说 ， 操 作 系统 包括 了 内 核 和 一 些 其 他 软件 ， 这 
些 软 件 使 得 计算 机 能 够 发 挥 作 用 ， 并 使 计算 机 具有 自己 的 特 
TE. 这 里 所 说 的 其 他 软件 包括 系统 实用 程序 (system utility). 
应 用 程序 、shell 以 及 公用 函数 库 等 。 1-1 UNIX 操作 系统 的 体系 结构 

例如 ，Linux 是 GNU 操作 系统 使 用 的 内 核 。 一 些 人 将 这 种 操作 系统 称 为 GNU/Linux 操作 系 
统 ， 但 是 ， 更 常见 的 是 简单 地 称 其 为 Lintx。 虽 然 这 种 表达 方法 在 严格 意义 上 讲 并 不 正确 ， 但 鉴 
于 “操作 系统 ”这 个 词 的 双重 含义 ， 这 种 叫 法 还 是 可 以 理解 的 《这样 的 叫 法 更 简洁 )。 


1.3 ”登录 


1. 登录 名 
用 户 在 登录 UNIX 系统 时 ， 先 键入 登录 名 ， 然 后 键入 口令 。 系 统 在 其 口令 文件 (通常 是 /etc/ 
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passwd 文件 ) 中 查看 登录 名 。 口 令 文件 中 的 登录 项 由 7 个 以 冒号 分 隔 的 字段 组 成 ， 依 次 是 : 登录 
名 、 加 蜜 口令、 数字 用 户 D (205)、 数 字 组 ID (105)、 注 释 字 段 、 起 始 目录 (/home/sar) 以 及 
shell 程序 (/bin/ksh). 


Sar:x:205:105:Stephen Rago: /home/sar: /bin/ksh 


目前 ， 所 有 的 系统 已 将 加 密 口 令 移 到 另 一 个 文件 中 。 第 6 章 将 说 明 这 种 文件 以 及 访问 它们 的 
函数 。 

2. shell 

用 户 登 录 后 ， 系 统 通常 先 显 示 一 些 系 统 信息 ， 然 后 用 户 就 可 以 向 shell 程序 键入 命令 。( 当 
用 户 登 录 时 ， 某 些 系统 启动 一 个 视窗 管理 程序 ， 但 最 终 总 会 有 一 个 shell 程序 运行 在 一 个 视窗 
H), shell 是 一 个 命令 行 解释 器 ， 它 读 取 用 户 输入 ， 然 后 执行 命令 。shell 的 用 户 输入 通常 来 自 
于 终端 (交互 式 shell)， 有 时 则 来 自 于 文件 〈 称 为 shell 脚本 )。 图 1-2 总 结 了 UNIX 系统 中 常见 
的 shell。 


| && | B FreeBSD 80 | Linux3.2.0 | MacOSX106.8 | Solaris 10 


Boume shell /bin/sh bash em 
Bourne-again shell /bin/bash 


C shell /bin/csh Ay eee tesh 
Korn shell /bin/ksh . 
TENEX C shell /bin/tcsh 





图 1-2 UNIX 系统 中 常见 的 shell 

系统 从 口令 文件 中 相应 用 户 登 录 项 的 最 后 一 个 字段 中 了 解 到 应 该 为 该 登录 用 户 执行 哪 一 
个 shell。 

自 V7 以 来 ， 由 Steve Bourne 在 贝尔 实验 室 开发 的 Bourne shell 得 到 了 广泛 应 用 ， 几 乎 每 一 个 
现 有 的 UNIX 系统 都 提供 Bourne shell， 其 控制 流 结构 类 似 于 Algol 68. 

C shell 是 由 Bill Joy 在 伯克利 开发 的 ， 所 有 BSD 版 本 都 提供 这 种 shell。 另 外 ，AT&T 的 
System V/386 R3.2 和 System V R4 (SVR4) 也 提供 C shell (下 一 章 将 对 这 些 不 同 版 本 的 UNIX 
系统 做 更 多 说 明 )。C shell 是 在 第 6 版 shell 而 非 Bourne shell 的 基础 上 构造 的 ， 其 控制 流 类 似 
于 C 语言 ， 它 支持 Bourne shell 没有 的 一 些 特 色 功 能 ， 例 如 作业 控制 、 历 史 机 制 以 及 命令 行 编 
辑 等 。 

Korn shell 是 Bourne shell 的 后 继 者 ， 它 首先 在 SVR4 中 提供 。Kom shell 是 由 贝尔 实验 室 的 
David Korn 开发 的 ， 在 大 多 数 UNIX 系统 上 运行 ， 但 在 SVR4 之 前 ， 通 常 它 需要 另行 购买 ， 所 以 
没有 其 他 两 种 shell 流行 。 它 与 Bourne shell 向 上 兼容 ， 并 具有 使 C shell 广泛 得 到 应 用 的 一 些 特 色 
功能 ， 包 括 作 业 控 制 以 及 命令 行 编辑 等 。 

Bourne-again shell 是 GNU shell, MA Linux 系统 都 提供 这 种 shell. 它 的 设计 遵循 POSIX 
标准 ， 同 时 也 保留 了 与 Bourne shell 的 兼容 性 。 它 支持 C shell 和 Korn shell 两 者 的 特色 
功能 。 

TENEX C shell 是 C shell 的 加 强 版 本 。 它 从 TENEX 操作 系统 (1972 年 BBN 公司 开发 ) 借 
鉴 了 很 多 特色 ， 例 如 命令 完备 。TENEX C shell 在 C shell 基础 上 增加 了 很 多 特性 ， 常 被 用 来 替 
换 C shell. 

POSIX 1003.2 标准 对 shell 进行 了 标准 化 。 这 项 规范 基于 Korn shell 和 Bourne shell 的 特性 。 
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不 同 的 Linux AHIRA REIRA shell, 一 些 Linux 默认 使 用 Boume again shell, 另外 一 些 使 用 BSD 
的 对 Bourne shell 的 替代 品 dash ( Debian Almquist shell， 最 早 由 Kenneth Almquist 开发 ， 并 在 后 来 移植 入 
”Linux ), FreeBSD 的 默认 用 户 shell 衍生 于 Almquist shell, Mac OS X 的 默认 shell 是 Boume-again shell; 
Solaries 继承 了 BSD 和 System V HH, 它 提供 了 图 1-2 中 所 示 的 所 有 shell。 在 因特网 上 可 以 
， 找到 shell 的 自由 移植 版 软件 。 
， 本 书 将 使 用 这 种 形式 的 注释 来 描述 历史 注释 ， 并 对 不 同 的 UNIX 系统 的 实现 进行 比较 。 当 我 
， 们 了 解 到 历史 缘由 后 ， 会 更 好 地 理解 采用 某 种 特定 实现 技术 的 原因 。 


本 书 将 使 用 很 多 交互 式 shell 实例 来 执行 所 开发 的 程序 ， 这 些 实例 使 用 了 Bourne shell. Korn 
shell 和 Bourne-again shell 通用 的 功能 。 


1.4 ”文件 和 目录 


1. 文件 系统 

UNIX 文件 系统 是 目录 和 文件 的 一 种 层次 结构 ， 所 有 东西 的 起 点 是 称 为 根 Croot) MAR, X 
个 目录 的 名 称 是 一 个 字符 “/”。 

目录 (directory) 是 一 个 包含 目录 项 的 文件 。 在 逻辑 上 ， 可 以 认为 每 个 目录 项 都 包含 一 个 文 
件 名 ， 同 时 还 包含 说 明 该 文件 属性 的 信息 。 文 件 属性 是 指 文件 类 型 (是 普通 文件 还 是 目录 等 )、 
文件 大 小 、 文件 所 有 者 、 文件 权限 (其 他 用 户 能 否 访问 该 文件 ) 以 及 文件 最 后 的 修改 时 间 等 。 stat 
和 fstat 函数 返回 包含 所 有 文件 属性 的 一 个 信息 结构 。 第 4 章 将 详细 说 明文 件 的 各 种 属性 。 


| 目录 项 的 逻辑 视图 与 实际 存放 在 磁盘 上 的 方式 是 不 同 的 。UNIX 文件 系统 的 大 多 数 实现 并 不 
| 在 目录 项 中 存放 属性 ， 这 是 因为 当 一 个 文件 具有 多 个 硬 链接 时 ， 很 难保 持 多 个 属性 副本 之 间 的 同 
| 步 。 这 一 点 将 在 第 4 章 讨论 硬 链接 时 理解 得 更 明晰 。 


2. 文件 名 

目录 中 的 各 个 名 字 称 为 文件 名 〈filename)。 只 有 斜 线 〈/) 和 空 字符 这 两 个 字符 不 能 出 现在 
文件 各 中 。 斜 线 用 来 分 隔 构成 路 径 名 的 各 文件 名 ， 空 字符 则 用 来 终止 一 个 路 径 和 名 。 尽 管 如 此 ， 好 
的 习惯 还 是 只 使 用 常用 印刷 字符 的 一 个 子 集 作为 文件 名 字符 〈 如 果 在 文件 名 中 使 用 了 某 些 shell 
的 特殊 字符 ， 则 必须 使 用 shel 的 引号 机 制 来 引用 文件 名 ， 这 会 带 来 很 多 麻烦 }。 事 实 上 ， 为 了 可 
移植 性 ，POSIX.1 推荐 将 文件 名 限制 在 以 下 字符 集 之 内 字母 Cac z. A~) MHF (0—9). 
句点 〈. )、 短 横 线 OC) 和 下 划 线 CO). 

创建 新 目录 时 会 自动 创建 了 两 个 文件 名 : . RAR) A... 〈 称 为 点 点 )。 点 指向 当前 目录 ， 
点 点 指向 父 目 录 。 在 最 高 层次 的 根 目录 中 ， 点 点 与 点 相同 。 [4] 


Research UNIX System 和 某 些 早期 UNIX System V 的 文件 系统 限制 文件 名 的 最 大 长 度 为 14 个 
FHF, BSD 版 本 则 将 这 种 限制 扩展 为 255 个 字符 。 现 今 ， 几 乎 所 有 商业 化 的 UNIX 文件 系统 都 支 
持 超过 255 个 字符 的 文件 名 。 


3. 路径 名 

由 斜 线 分 隔 的 一 个 或 多 个 文件 名 组 成 的 序列 (也 可 以 斜 线 开头 ) 构成 路 径 名 〈pathname)， 以 斜 线 
开头 的 路 径 名 称 为 绝对 路 径 名 (absolute pathname)， 否 则 称 为 相对 路 径 名 (relative pathname)。 相 对 路 
径 名 指向 相对 于 当前 目录 的 文件 。 文 件 系 统 根 的 名 字 (/) 是 一 个 特殊 的 绝对 路 径 名 ， 它 不 包含 文件 名 。 
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E 实例 
不 难 列 出 一 个 目录 中 所 有 文件 的 名 字 ， 图 1-3 是 1 s(1) 命 令 的 简要 实现 。 


#include "apue.h" 
#include <dirent.h> 


int 
main(int argc, char *argv[]) 
{ 
DIR *dp; 
struct dirent *dirp; 


if (argc != 2) 
err quit("usage: ls directory name"); 


if ((dp = opendir(argv[1])) == NULL) 
err sys("can't open $s", argv[1]); 

while ((dirp = readdir(dp)) != NULL) 
printf("$sWn", dirp-»d name); 


closedir (dp); 
exit (0); 


1-3” 列 出 一 个 目录 中 的 所 有 文件 
1s(1) 这 种 表示 方法 是 UNIX 系统 的 惯用 方法 ， 用 以 引用 UNIX 系统 手册 中 的 一 个 特定 项 。 
1s(1) 引 用 第 一 部 分 中 的 1s 项 。 各 部 分 通常 用 数字 1 一 8 编号 ， 在 每 个 部 分 中 的 各 项 则 按 字 母 顺 
序 排列 。 在 本 书 中 始终 假定 你 有 自己 所 使 用 的 UNIX 系统 的 手册 。 


早期 的 UNIX 系统 把 8 个 部 分 都 集中 在 一 本 《UNIX 程序 员 手 册 》( UNIX Programmer S 
Manual) 中 。 随 着 页 数 的 增加 ， 现 在 的 趋势 是 把 这 些 部 分 分 别 安排 在 不 同 的 手册 中 ， 例 如 用 户 
手册 、 程 序 员 手册 以 及 系统 管理 页 手册 等 。 

一 些 UNIX 系统 用 大 写字 母 把 某 一 部 分 手册 进一步 分 成 若干 小 部 分 ， 例 如 ，AT&T[1990e] 中 
的 所 有 标准 VO 函数 都 被 指明 位 于 3S 部 分 中 , 例如 fopen(3S)。 另 一 些 UNIX 系统 不 用 数字 而 是 
用 字母 将 手册 分 成 若干 部 分 ， 如 用 C 表示 命令 部 分 等 。 


RS, 大 多 数 手册 都 以 电子 文档 形式 提供 。 如 果 用 的 是 联机 手册 ， 则 可 用 下 面 的 命令 查看 1s 
命令 手册 页 : 

man 1 1s 
或 

man -sl ls 


: 图 1-3 只 打印 一 个 目录 中 各 个 文件 的 名 字 ， 不 显示 其 他 信息 ， 如 果 该 源 文件 名 为 myls .c， 
则 可 以 用 下 面 的 命令 对 其 进行 编译 ， 编 译 结果 是 生成 默认 名 为 a. out 的 可 执行 文件 中 。 


CC myls.c 
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历史 上 ，cc(1) 是 C 编译 器 。 在 配置 了 GNUC 编译 系统 的 系统 中 ，C 编译 器 是 gcc(1)。 其 中 ， 
cc 通常 链接 至 gcc, 


示例 输出 如 下 : 


$ ./a.out /dev 


很 多 行 未 显示 
mem 
$ ./a.out /etc/ssl/private 
can't open /etc/ssl/private: Permission denied 
$ ./a.out /dev/tty 
can't open /dev/tty: Not a directory 


本 书 将 以 以 下 方式 表示 输入 的 命令 及 其 输出 : 输入 的 字符 以 等 宽 粗 体 表示 ， 程 序 输出 则 以 上 
面 所 示 的 等 宽 字体 表示 。 对 输出 的 注释 以 中 文 宋体 表示 。 输 入 之 前 的 美元 符号 (S) 是 shell 的 提 [ 6 | 
示 符 ， 本 书 总 是 将 shell 提示 符 表 示 为 $。 
注意 , myls 程序 列 出 的 目录 中 的 文件 名 不 是 以 字母 顺序 列 出 的 ,而 1s 命令 一 般 是 按 字母 顺 
序 打 印 目 录 项 。 
在 这 个 20 行 的 程序 中 ， 有 很 多 细节 需要 考虑 。 
。 He, 其 中 包含 了 一 个 头 文件 apue .h。 本 书 中 几乎 每 一 个 程序 都 包含 此 头 文件 。 它 包含 
了 某 些 标准 系统 头 文件 ， 定 义 了 许多 常量 及 函数 原型 ， 这 些 都 将 用 于 本 书 的 各 个 实例 中 ， 
附录 B 列 出 了 这 一 头 文件 。 
e. 接 下 来 ， 我 们 包含 了 一 个 系统 头 文件 dirent .h， 以 便 使 用 opendir 和 readdir Hm 
数 原 型 ， 以 及 dirent 结构 的 定义 。 在 其 他 一 些 系 统 里 ， 这 些 定义 被 分 成 多 个 头 文 件 。 
比如 ， 在 Ubuntu 12.04 'P, /usr/include/dirent.h 声明 了 函数 原型 ， 并 且 包 含 
pits/dirent.h， 后 者 定义 了 dirent 结构 (真正 存放 在 /usr/include/x86_64- 
linux-gnu/bits 下 )。 
e main 函数 的 声明 使 用 了 ISO C 标准 所 使 用 的 风格 〈 下 一 章 将 对 ISO C 标准 进行 更 多 
Vi BH. 
。 程序 获取 命令 行 的 第 1 个 参数 argv [1] 作为 要 列 出 其 各 个 目录 项 的 目录 名 。 第 7 章 将 说 
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HJ main 函数 如 何 被 调用 ， 程 序 如 何 存 取 命 令 行 参数 和 环境 变量 。 

。 因为 各 种 不 同 UNIX 系统 目录 项 的 实际 格式 是 不 一 样 的 ， 所 以 使 用 函数 opendir. 
readdir 和 closedir 对 目录 进行 处 理 。 

。 opendir 函数 返回 指向 DIR 结构 的 指针 ， 我 们 将 该 指针 传送 给 readdir 函数 。 我 们 并 
不 关心 DIR 结构 中 包含 了 什么 。 然 后 ， 在 循环 中 调用 readdir 来 读 每 个 目录 项 。 它 返 
回 一 个 指向 dirent 结构 的 指针 ， 而 当 目 录 中 已 无 目录 项 可 读 时 则 返回 null 指针 。 在 
dirent 结构 中 取出 的 只 是 每 个 目录 项 的 名 字 〈d_name )。 使 用 该 名 字 ， 此 后 就 可 调用 
stat 函数 〈 见 4.2 节 ) 以 获得 该 文件 的 所 有 属性 。 

。 程序 调用 了 两 个 自 编 的 函数 对 错误 进行 处 理 ，err_sys 和 err_quit。 从 上 面 的 输出 中 
可 以 看 到 ，err_sys 函数 打印 一 条 消息 (“Permission denied" 2€ “Not a directory”), W 
明 遇 到 了 什么 类 更 的 错误 。 这 两 个 出 错 处 理 消 数 在 附录 B 中 说 明 ，1.7 节 将 更 多 地 叙述 出 
错 处 理 。 

e 当 程 序 将 结束 时 ， 它 以 参数 0 调用 函数 exit. A% exit 终止 程序 。 按 惯例 ， 参 数 0 的 
意思 是 正常 结束 ， 参 数值 1~255 则 表示 出 错 。8.5 节 将 说 明 一 个 程序 《如 shell 或 我 们 所 
编写 的 程序 ) 如 何 获得 它 所 执行 的 另 一 个 程序 的 exit KAS. "i 


4. 工作 目录 

每 个 进程 都 有 一 个 工作 目录 (working directory )， 有 时 称 其 为 当前 工作 目录 (current working 
directory )。 所 有 相对 路 径 名 都 从 工作 目录 开始 解释 。 进 程 可 以 用 chdir 函数 更 改 其 工作 目录 。 

例如 ， 相 对 路 径 名 doc/memo/joe 指 的 是 当前 工作 目录 中 的 doc 目录 中 的 memo 目录 中 的 
文件 (RAS) joe。 从 该 路 径 名 可 以 看 出 ，doc 和 memo 都 应 当 是 目录 ， 但 是 却 不 能 分 辨 joe 
是 文件 还 是 目录 。 路 径 名 /urs/1ib/1lint 是 一 个 绝对 路 径 名 , 它 指 的 是 根 目 录 中 的 usr 目录 中 
的 lib 目录 中 的 文件 (或 目录 ) lint. 

5. 起 始 目录 

登录 时 ， 工 作 目 录 设 置 为 起 始 目 录 (Dome directory )， 该 起 始 目 录 从 口令 文件 ( 见 1.3 节 ) 中 
相应 用 户 的 登录 项 中 取得 。 


1.5 输入 和 输出 


1. 文件 描述 符 

文件 描述 符 〈file descriptor) 通常 是 一 个 小 的 非 负 整数 ， 内 核 用 以 标识 一 个 特定 进程 正在 访 
问 的 文件 。 当 内 核 打开 一 个 现 有 文件 或 创建 一 个 新 文件 时 ， 它 都 返回 一 个 文件 描述 符 。 在 读 、 写 
文件 时 ， 可 以 使 用 这 个 文件 描述 符 。 

2. 标准 输入 、 标 准 输 出 和 标准 错误 

按 惯例 ， 每 当 运 行 一 个 新 程序 时 ， 所 有 的 shell 都 为 其 打开 3 个 文件 描述 符 ， 即 标准 输入 
(standard input)、 标 准 输出 (standard output) 以 及 标准 错误 standard error)。 如 果 不 做 特殊 处 理 ， 
例如 就 像 简单 的 命令 1s， 则 这 3 个 描述 符 都 链接 向 终端 。 大 多 数 shell 都 提供 一 种 方法 ， 使 其 中 
任何 一 个 或 所 有 这 3 个 描述 符 都 能 重新 定向 到 某 个 文件 ， 例 如 : 


ls > file.list 


执行 1s 命令 ， 其 标准 输出 重新 定向 到 名 为 file .1ist 的 文件 。 
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3 不 带 缓冲 的 MO 
函数 open. read. write. lseek 以 及 close 提供 了 不 带 缓 冲 的 IJO。 这 些 孙 数 都 使 用 文 
件 描述 符 。 


a 实例 
如 果 愿 意 从 标准 输入 读 ， 并 向 标准 输出 写 ， 则 图 1-4 中 所 示 的 程序 可 用 于 复制 任 一 UNIX 普 
通 文件 。 


#include "apue.h" 
#define BUFFSIZE 4096 


int 
main (void) 
{ 
int n; 
char buf [BUFFSIZE]; 


while ((n = read (STDIN_FILENO, buf, BUFFSIZE)) > 0) 
if (write (STDOUT_FILENO, buf, n) !- n) 
err sys("write error"); 


if (n < 0) 
err sys("read error"); 


exit (0); 


1-4. 将 标准 输入 复制 到 标准 输出 

头 文件 <unista.h> Capue.h 中 包含 了 此 头 文件 》 及 两 个 常量 STDIN_FILENO Al STDOUT_ 
FILENO 是 POSIX 标准 的 一 部 分 〈 下 一 章 将 对 此 做 更 多 的 说 明 )。 头 文件 cunistd.h> 包 含 了 很 
多 UNIX 系统 服务 的 函数 原型 ， 例 如 图 1-4 程序 中 调用 的 read 和 write。 

两 个 常量 STDIN FILENO 和 STDOUT_FILENO 定义 在 <unistd.h> 头 文件 中 ， 它 们 指定 了 
标准 输入 和 标准 输出 的 文件 描述 符 。 在 POSIX 标准 中 ， 它 们 的 值 分 别 是 0 和 1， 但 是 考虑 到 可 读 
性 ， 我 们 将 使 用 这 些 名 字 来 表示 这 些 常 量 。 

3.9 节 将 详细 讨论 BUFFSIZE 常量 ， 说 明 它 的 各 种 不 同 值 将 如 何 影 响 程序 的 效率 。 但 是 不 管 
该 常量 的 值 如 何 ， 此 程序 总 能 复制 任 一 UNIX 普通 文件 。 

read 函数 返回 读 取 的 字 节 数 ， 此 值 用 作 要 写 的 字 节 数 。 当 到 达 输 入 文件 的 尾 端 时 ，read 返 
回 0， 程 序 停 止 执 行 。 如 果 发 生 了 一 个 读 错误 ，read 返回 -1。 出 错时 大 多 数 系统 函数 返回 -1。 

如 果 将 该 程序 编译 成 标准 名 称 的 a.out 文件 ， 并 以 下 列 方式 执行 它 : 

./a.out > data 
那么 标准 输入 是 终端 ， 标 准 输出 则 重新 定向 至 文件 data， 标 准 错误 也 是 终端 。 如 果 此 输出 文件 
并 不 存在 ， 则 shell 会 创建 它 。 该 程序 将 用 户 键入 的 各 行 复 制 到 标准 输出 ， 键 入 文件 结束 符 〈 通 常 
是 Ctrl+D) 时 ， 将 终止 本 次 复制 。 

车 以 下 列 方式 执行 该 程序 : 


./a.out < infile > outfile 


[9] 
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会 将 名 为 infile 文件 的 内 容 复 制 到 名 为 out file 的 文件 中 。 a 


第 3 章 将 更 详细 地 说 明 不 带 缓冲 的 IO 函数 。 

4. 标准 I/O 

标准 UO 函数 为 那些 不 带 缓冲 的 VO 函数 提供 了 一 个 带 缓 冲 的 接口 。 使 用 标准 VO 函数 无 需 
担心 如 何 选取 最 佳 的 缓冲 区 大 小 ， 如 图 1-4 中 的 BUFFSIZE 常量 的 大 小 。 使 用 标准 VO 函数 还 简 
化 了 对 输入 行 的 处 理 (常常 发 生 在 UNIX 的 应 用 程序 中 )。 例 如 ，fgets 函数 读 取 一 个 完整 的 行 ， 
而 read 函数 读 取 指 定 字 节 数 。 在 5.4 节 中 我 们 将 了 解 到 ， 标 准 VO 函数 库 提 供 了 使 我 们 能 够 控 
制 该 库 所 使 用 的 缓冲 风格 的 函数 。 

我 们 最 熟悉 的 标准 VO 函数 是 printf。 在 调用 printf 的 程序 中 , 总 是 包含 <stdio.h>( 在 
本 书 中 ， 该 头 文件 包含 在 apue .h 中 )， 该 头 文件 包括 了 所 有 标准 VO 函数 的 原型 。 


^. 实例 


1-5 程序 的 功能 类 似 于 前 一 个 调用 了 read 和 write 的 程序 ，5.8 节 将 对 此 程序 进行 更 详 
细 的 说 明 。 它 将 标准 输入 复制 到 标准 输出 ， 也 就 能 复制 任 一 UNIX 普通 文件 。 


#include "apue.h" 


int 
main(void) 
{ 


int CI 


while ((c = getcí(stdin)) != EOF} 
if (putc(c, stdout) -- EOF) 
err Sys("output error"); 


if (ferror{stdin) ) 
err_sys("input error"); 


exit (0); 


1-5 用 标准 VO 将 标准 输入 复制 到 标准 输出 
函数 getc 一 次 读 取 一 个 字符 ， 然 后 函数 putc 将 此 字符 写 到 标准 输出 。 读 到 输入 的 最 后 一 
个 字 节 时 , gete 返回 常量 Eor (该 常量 在 <stdio .h> 中 定义 )。 标 准 IO 常量 stdin 和 saput 
也 在 头 文件 <stdio .h> 中 定义 ， 它 们 分 别 表示 标准 输入 和 标准 输出 。 a 


1.6 ”程序 和 进程 


1. 程序 

程序 (program) 是 一 个 存储 在 磁盘 上 某 个 目录 中 的 可 执行 文件 。 内 核 使 用 exec 函数 〈7 个 
exec 函数 之 一 )， 将 程序 读 入 内 存 ， 并 执行 程序 。8.10 节 将 说 明 这 些 exec MR. 

2. 进程 和 进程 ID 

程序 的 执行 实例 被 称 为 进程 〈process)。 本 书 的 每 一 页 几乎 都 会 使 用 这 一 术语 。 某 些 操作 系 
统 用 任务 (task) 表示 正在 被 执行 的 程序 。 
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UNIX 系统 确保 每 个 进程 都 有 一 个 唯一 的 数字 标识 符 ， 称 为 进程 ID (process ID). 进程 ID 总 
是 一 个 非 负 整数 。 


"m Sc 
图 1-6 程序 用 于 打印 进程 ID。 


#include "apue.h" 


int 

main (void) 

{ 
printf ("hello world from process ID %ld\n", (long) getpid()); 
exit {0); 


图 1-6 打印 进程 ID 
如 果 将 该 程序 编译 成 a .out 文件， 然后 执行 它 ， 则 有 : 


$ ./a.out 
hello world from process ID 851 
$ ./a.out 
hello world from process ID 854 


此 程序 运行 时 ， 它 调用 函数 getpid 得 到 其 进程 站。 我 们 将 会 在 后 面 看 到 ，getpPid 返回 一 个 
pid t 数据 类 型 。 我 们 不 知道 它 的 大 小 ， 仅 知道 的 是 标准 会 保证 它 能 保存 在 一 个 长 整 型 中 。 因 为 
我 们 必须 在 printf 函数 中 指定 需要 打印 的 每 一 个 变量 的 大 小 ， 所 以 我 们 必须 把 它 的 值 强制 转换 
为 它 可 能 会 用 到 的 最 大 的 数据 类 型 (这 里 是 长 整 型 )。 明 然 大 多 数 进程 ID 可 以 用 整 型 表示 ， 但 用 
长 整 型 可 以 提高 可 移植 性 。 

3. 进程 控制 

有 3 个 用 于 进程 控制 的 主要 函数 : fork. exec 和 waitpid. (exec 函数 有 7 种 变 体 ， 但 
经 常 把 它们 统称 为 exec MRM.) 


实例 
UNIX 系统 的 进程 控制 功能 可 以 用 一 个 简单 的 程序 说 明 ( 见 图 1.7)。 该 程序 从 标准 输入 读 取 
命令 ， 然 后 执行 这 些 命令 。 它 类 似 于 shell 程序 的 基本 实施 部 分 。 


finclude "apue.nh" 
#include <sys/wait.h> 


int 

main (void) 

{ 
char buf [MAXLINE]; /* from apue.h */ 
pid t pid; 
int status; 


printf("$9 "); /* print prompt (printf requires $$ to print $) */ 
while (fgets(buf, MAXLINE, stdin) !- NULL) { 
if (buf[strlen(buf) - 1] == '\n') 
buf[strlen(buf) - 1] = 0; /* replace newline with null */ 
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if ((pid = fork) < 0) ( 
err Sys("fork error"); 

) else if (pid == 0) 1 /* child */ 
execlp(buf, buf, (char *)0); 
err ret("couldn't execute: $s", buf); 
exit(127); 

) 


/* parent */ 
if ((pid = waitpid(pid, &status, 0)) < 0) 
err sys("waitpid error"); 
printf("$$ "); 
) 
exit (0); 


1-7 从 标准 输入 读 命 令 并 执行 

在 这 个 30 行 的 程序 中 ， 有 很 多 功能 需要 考虑 。 

。 用 标准 VO 函数 fgets 从 标准 输入 一 次 读 取 一 行 。 当 键入 文件 结束 符 (通常 是 Ctrl+D) 作 
为 行 的 第 一 个 字符 时 ，fgets 返回 一 个 null 指针 ， 于 是 循环 停止 ， 进 程 也 就 终止 。 第 18 
章 将 说 明 所 有 特殊 的 终端 字符 (文件 结束 、 退 格 字符 、 整 行 擦 除 等 )， 以 及 如 何 改 变 它们 。 

e 因为 fgets 返回 的 每 一 行 都 以 换行 符 终止 ， 后 随 一 个 null 字 节 ， 因 此 用 标准 C 函数 strlen 
计算 此 字符 串 的 长 度 ， 然 后 用 一 个 null 字 节 替换 换行 符 。 这 样 做 是 因为 execlp 函数 要 
求 的 参数 是 以 null 结束 的 而 不 是 以 换行 符 结束 的 。 

e 调用 fork 创建 一 个 新 进程 。 新 进程 是 调用 进程 的 一 个 副本 ,我 们 称 调用 进程 为 父 进程 ， 
新 创建 的 进程 为 子 进程 。fork 对 父 进程 返回 新 的 子 进程 的 进程 ID 〈 一 个 非 负 整 数 ?》， 对 
子 进程 则 返回 0。 因 为 fork 创建 一 个 新 进程 ， 所 以 说 它 被 调用 一 次 〈 由 父 进程 )， 但 返 
回 两 次 〈 分 别 在 父 进程 中 和 在 子 进程 中 )。 

。 在 子 进程 中 ， 调 用 execlp 以 执行 从 标准 输入 读 入 的 命令 。 这 就 用 新 的 程序 文件 替换 了 
子 进 程 原先 执行 的 程序 文件 。fcrk 和 跟随 其 后 的 exec 两 者 的 组 合 就 是 某 些 操作 系统 所 
称 的 产生 (spawn) 一 个 新 进程 。 在 UNIX 系统 中 ， 这 两 部 分 分 离 成 两 个 独立 的 函数 。 第 
8 章 将 对 这 些 函 数 进行 更 多 说 明 。 

e 子 进程 调用 execlp 执行 新 程序 文件 ， 而 父 进程 希望 等 待 子 进程 终止 ， 这 是 通过 调用 
waitpid 实现 的 ， 其 参数 指定 要 等 待 的 进程 ( 即 pia BRETHE ID). waitpid Ñ 
数 返 回 子 进程 的 终止 状态 (status 变量 )。 在 我 们 这 个 简单 的 程序 中 ， 没 有 使 用 该 值 。 
如 果 需 要 ， 可 以 用 此 值 准确 地 判定 子 进 程 是 如 何 终止 的 。 

。 该 程序 的 最 主要 限制 是 不 能 向 所 执行 的 命令 传递 参数 。 例 如 不 能 指定 要 列 当 目录 项 的 目 
录 名 ， 只 能 对 工作 目录 执行 ls 命令 。 为 了 传递 参数 ， 先 要 分 析 输 入 行 ， 然 后 用 某 种 约定 
把 参数 分 开 〈 可 能 使 用 空格 或 制 表 符 )， 再 将 分 隔 后 的 各 个 参数 传递 给 execlp 函数 。 尽 
管 如 此 ， 此 程序 仍 可 用 来 说 明 UNIX 系统 的 进程 控制 功能 。 

如 果 运 行 此 程序 ， 将 得 到 下 列 结果 。 注 意 ， 该 程序 使 用 了 一 个 不 同 的 提示 符 (%)， 以 区 别 于 

shell 的 提示 符 。 


$ ./a.out 
% date 
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Sat Jan 21 19:42:07 EST 2012 

% who 

Sar console Jan 1 14:59 

Sar ttys000 Jan i 14:59 

sar ttysOOl Jan 15 15:28 

% pwd 

/home/sar/bk/apue/3e 

$ 1s 

Makefile 

a.out 

shelli.c 

% ^D 键入 文件 结束 符 
$ 常规 的 shell 提示 符 


B 
E 


^D 表示 一 个 控制 字符 。 控 制 字符 是 特殊 字符 ,其 构成 方法 是 : 在 键盘 上 按 下 控制 键 一 一 通常 
: 被 标记 为 Control 或 Ctrl, 同时 按 另 一 个 键 。CHtrlit+D 或 ^D 是 默认 的 文件 结束 符 。 在 第 18 章 中 
， 讨 论 终端 1/O 时 ， 会 介绍 更 多 的 控制 字符 。 


4， 线 程 和 线程 ID 

通常 ， 一 个 进程 只 有 一 个 控制 线程 (thread〉 一 一 某 一 时 刻 执行 的 一 组 机 器 指令 。 对 于 某 些 
问题 ， 如 果 有 多 个 控制 线程 分 别 作用 于 它 的 不 同 部 分 ， 那 么 解决 起 来 就 容易 得 多 。 另 外 ， 多 个 控 
制 线程 也 可 以 充分 利用 多 处 理 器 系统 的 并 行 能 力 。 

一 个 进程 内 的 所 有 线程 共享 同一 地 址 空间 、 文 件 描述 符 、 栈 以 及 与 进程 相关 的 属性 。 因 为 它 
们 能 访问 同一 存储 区 ， 所 以 各 线程 在 访问 共享 数据 时 需要 采取 同步 措施 以 避免 不 一 致 性 。 

与 进程 相同 ， 线 程 也 用 ID 标识 。 但 是 ， 线 程 D 只 在 它 所 属 的 进程 内 起 作用 。 一 个 进程 中 的 
线程 ID 在 另 一 个 进程 中 没有 意义 。 当 在 一 进程 中 对 某 个 特定 线程 进行 处 理 时 ， 我 们 可 以 使 用 该 
线程 的 ID 引用 它 。 

控制 线程 的 函数 与 控制 进程 的 函数 类 似 , 但 男 有 一 套 。 线程 模型 是 在 进程 模型 建立 很 久之 后 才 被 
引入 到 UNIX 系统 中 的 ， 然 而 这 两 种 模型 之 间 存 在 复杂 的 交互 ， 在 第 12 章 中 ,我们 会 对 此 进行 说 明 。 


1.7 ”出 错 处 理 


当 UNIX 系统 函数 出 错时 ， 通 常会 返回 一 个 负 值 ， 而 且 整 型 变量 errno 通常 被 设置 为 具有 特定 
信息 的 值 。 例 如 ，open 函数 如 果 成 功 执行 则 返回 一 个 非 负 文件 描述 符 ， 如 出 错 则 返回 -1。 在 open 
出 错时 ， 有 大 约 15 种 不 同 的 errno 值 (文件 不 存在 、 权 限 问 题 等 )。 而 有 些 函 数 对 于 出 错 则 使 用 另 
一 种 约定 而 不 是 返回 负 值 。 例 如 ， 大 多 数 返 回 指向 对 象 指针 的 函数 ， 在 出 错时 会 返回 一 个 null 指针 。 

文件 <errno .h> 中 定义 了 errno 以 及 可 以 赋 与 它 的 各 种 常量 。 这 些 常量 都 以 字符 E 开头 。 
325^, UNIX 系统 手册 第 2 部 分 的 第 1 页 ，intro(2) 列 出 了 所 有 这 些 出 错 常量 。 ibn, S errno 
等 于 常量 EACCES， 表 示 产 生 了 权限 问题 例如， 没有 足够 的 权限 打开 请 求 文件 )。 


Æ Linux 中 ， 出 错 常量 在 errno(3) 手 册页 中 列 出 。 


POSIX 和 ISO C 将 errno 定义 为 一 个 符号 ， 它 扩展 成 为 一 个 可 修改 的 整形 左 值 (lvalue)。 
它 可 以 是 一 个 包含 出 错 编号 的 整数 , 也 可 以 是 一 个 返回 出 错 编号 指针 的 函数 。 以 前 使 用 的 定义 是 : 


extern int errno; 
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但 是 在 支持 线程 的 环境 中 ， 多 个 线程 共享 进程 地 址 空间 ， 每 个 线程 都 有 属于 它 自 己 的 局 部 errno 
以 避免 一 个 线程 干扰 男 一 个 线程 。 例 如 ，Linux 支持 多 线程 存 取 errno， 将 其 定义 为 : 


extern int * errno location(void); 
define errno (* errno location(]) 


对 于 errno 应 当 注 意 两 条 规则 。 第 一 条 规则 是 ， 如 果 没 有 出 错 ， 其 值 不 会 被 例 程 清除 。 
此 ， 仅 当 函 数 的 返回 值 指明 出 错时 ， 才 检验 其 值 。 第 二 条 规则 是 ， 任何 函数 都 不 会 将 errno 值 
设置 为 0， 而 且 在 <errno.h> 中 定义 的 所 有 常量 都 不 为 0。 
C 标准 定义 了 两 个 函数 ， 它 们 用 于 打印 出 错 信息 。 
#include <string.h> 
char *strerrorlíint errnum); 
返回 值 : 指向 消息 字符 串 的 指针 
strerror 函数 将 errnum (通常 就 是 errno (ED 映射 为 一 个 出 错 消息 字符 串 ， 并 且 返 回 此 
字符 串 的 指针 。 
perror 图 数 基于 errno 的 当前 值 ， 在 标准 错误 上 产生 一 条 出 错 消息 ， 然 后 返回 。 


void perror(const char *msg); 
它 首先 输出 由 mg 指向 的 字符 串 ， 然 后 是 一 个 冒号 ， 一 个 空格 ， 接 着 是 对 应 于 errno 值 的 
出 错 消息 ， 最 后 是 一 个 换行 符 。 


a cB 
1-8 程序 显示 了 这 两 个 出 错 函数 的 使 用 方法 。 


#include "apue.h" 
#include «errno.h» 


int 
main(int argc, char *argv[]) 
[ 
fprintf(stderr, "EACCES: %s\n", strerror(EACCES)); 
errno = ENOENT; 
perror (argv[0]):; 
exit (0); 


1-8 Bis strerror 和 perror 


如 果 将 此 程序 编译 成 文件 a.out， 然 后 执行 它 ， 则 有 


$ ./a.out 
EACCES: Permission denied 
./a.out: No such file or directory 


注意 ， 我 们 将 程序 名 (argv[0] ， 其 值 是 . /a .out) 作为 参数 传递 给 perror。 这 是 一 个 标准 的 
UNIX 惯例 。 使 用 这 种 方法 ， 在 程序 作为 管道 的 一 部 分 执行 时 ， 例 如 : 


progl < inputfile | prog2 | prog3 > outputfile 
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我 们 就 能 分 清 3 个 程序 中 的 哪 一 个 产生 了 一 条 特定 的 出 错 消息 。 


本 书 中 的 所 有 实例 基本 上 都 不 直接 调用 strerror 或 perror, 而 是 使 用 附录 BPW 
数 。 该 附录 中 的 出 错 函 数 使 我 们 只 用 一 条 C 语句 就 可 利用 ISO C 的 可 变 参 数 表 功能 处 理 出 错 情况 。 

出 错 恢复 

可 将 在 <errno.h> 中 定义 的 各 种 出 错 分 成 两 类 : 致命 性 的 和 非 致 命 性 的 ,对 于 致命 性 的 错误 ， 
无 法 执行 恢复 动作 。 最 多 能 做 的 是 在 用 户 屏幕 上 打印 出 一 条 出 错 消 息 或 者 将 一 条 出 错 消息 写 入 日 
志文 件 中 ， 然 后 退出 。 对 于 非 致命 性 的 出 错 ， 有 时 可 以 较 妥 善 地 进行 处 理 。 大 多 数 非 致 命 性 出 错 
是 暂时 的 《如 资源 短缺 )， 当 系统 中 的 活动 较 少 时 ， 这 种 出 错 很 可 能 不 会 发 生 。 

与 资源 相关 的 非 致 命 性 出 错 包 括 : EAGAIN. ENFILE. ENOBUFS. ENOLCK. ENOSPC, 
EWOULDBLOCK， 有 时 ENOMEM 也 是 非 致命 性 出 错 。 当 EBUSY 指明 共享 资源 正在 使 用 时 ， 也 可 将 
它 作为 非 致 命 性 出 错 处 理 。 当 EINTR 中 断 一 个 慢 速 系 统 调 用 时 ， 可 将 它 作为 非 致命 性 出 错 处 理 
(XE 10.5 节 对 此 会 进行 更 多 说 明 )。 

对 于 资源 相关 的 非 致 命 性 出 错 的 典型 恢复 操作 是 延迟 一 段 时 间 ， 然 后 重 试 。 这 种 技术 可 应 用 
于 其 他 情况 。 例 如 ， 假 设 出 错 表明 一 个 网 络 连接 不 再 起 作用 ， 那 么 应 用 程序 可 以 采用 这 种 方法 ， 
在 短 时 间 延 迟 后 ， 党 试 重建 该 连接 。 一 些 应 用 使 用 指数 补偿 算法 ， 在 每 次 迭代 中 等 待 更 长 时 间 。 

最 终 ， 由 应 用 的 开发 者 决定 在 哪些 情况 下 应 用 程序 可 以 从 出 错 中 恢复 。 如 果 能 够 采用 一 种 合 
理 的 恢复 策略 ， 那 么 可 以 避免 应 用 程序 异常 终止 ， 进 而 就 能 改善 应 用 程序 的 健壮 性 。 


1.8 ”用 户 标识 


1， 用 户 ID 
口令 文件 登录 项 中 的 用 户 ID userID) 是 一 个 数值 ， 它 向 系统 标识 各 个 不 同 的 用 户 。 系 统 
管理 员 在 确定 -- 个 用 户 的 登录 名 的 同时 ， 确 定 其 用 户 ID。 用 户 不 能 更 改 其 用 户 ID。 通常 每 个 用 
户 有 一 个 唯一 的 用 户 ID。 下 面 将 介绍 内 核 如 何 使 用 用 户 ID 来 检验 该 用 户 是 千 有 执行 某 些 操作 
的 权限 。 
用 户 ID 为 0 的 用 户 为 根 用 户 (root》 或 超级 用 户 (superuser). ASKED, BRAT 
登录 项 ， 其 登录 名 为 root， 我 们 称 这 种 用 户 的 特权 为 超级 用 户 特权 。 我 们 将 在 第 4 章 中 看 到 ， 
如 果 一 个 进程 具有 超级 用 户 特权 ， 则 大 多 数 文件 权限 检查 都 不 再 进行 。 某 些 操作 系统 功能 只 向 超 
级 用 户 提供 ， 超 级 用 户 对 系统 有 自由 的 支配 权 。 


| Mac OS X 客户 端 版 本 交 由 用 户 使 用 时 ,禁用 超级 用 户 账户 , 服务 器 版 本 则 可 使 用 该 账户 。 在 
Apple 的 网 站 可 以 找到 使 用 说 明 ， 它 告知 如 何 才 能 使 用 该 帐户。 参见 nttp://support. 
apple.com/kb/HT1528, 

2. tB ID 

口令 文件 登录 项 也 包括 用 户 的 组 ID (group ID)， 它 是 一 个 数值 。 组 ID 也 是 由 系统 管理 
员 在 指定 用 户 登 录 名 时 分 配 的 。 一 般 来 说 ， 在 口令 文件 中 有 多 个 登录 项 具有 相同 的 组 ID。 组 
被 用 于 将 若干 用 户 集合 到 项 目 或 部 门 中 去 。 这 种 机 制 允 许 同 组 的 各 个 成 员 之 间 共 享 资源 (如 
文件 )。4.5 节 将 介绍 可 以 通过 设置 文件 的 权限 使 组 内 所 有 成 员 都 能 访问 该 文件 ， 而 组 外 用 户 
不 能 访问 。 

组 文件 将 组 名 映射 为 数值 的 组 ID。 组 文件 通常 是 /etc/group。 
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使 用 数值 的 用 户 ID 和 数值 的 组 ID 设置 权限 是 历史 上 形成 的 。 对 于 磁盘 上 的 每 个 文件 ， 文 件 
系统 都 存储 该 文件 所 有 者 的 用 户 ID 和 组 ID。 存 储 这 两 个 值 只 需 4 个 字 节 《假定 每 个 都 以 双 字 节 
的 整 型 值 存放 )。 如 果 使 用 完整 ASCI 登录 名 和 组 名 ， 则 需 更 多 的 磁盘 空间 。 另 外 ， 在 检验 权限 
期 间 ， 比 较 字 符 串 较 之 比较 整 型 数 更 消耗 时 间 。 

但 是 对 于 用 户 而 言 ， 使 用 名 字 比 使 用 数值 方便 ， 所 以 口令 文件 包 食 了 登录 名 和 用 户 ID 之 间 
的 映射 关系 ， 而 组 文件 则 包含 了 组 名 和 组 ID 之 间 的 映射 关系 。 例 如 ，1s -1 命令 使 用 口令 文件 
将 数值 的 用 户 ID 映射 为 登录 名 ， 从 而 打印 出 文件 所 有 者 的 登录 名 。 


| 早期 的 UNIX 系统 使 用 16 位 整 型 教 表示 用 户 ID 和 组 ID。 现今 的 UNIX 系统 使 用 32 位 整 型 
| 数 表示 用 户 ID 和 组 ID。 


a 实例 
图 1-9 程序 用 于 打印 用 户 TD 和 组 TD. 


#include "apue.h" 

int 

main(void) 

{ 
printf ("uid = td, gid = $dMn", getuid(), getgid()); 
exit(0); 


1-9 ”打印 用 户 ID 和 组 ID 
程序 调用 getuid 和 getgid 以 返回 用 户 ID 和 组 ID 。 运 行 该 程序 的 结果 如 下 : 


$ ./a.out 
uid = 205, gid = 105 z 


3， 附 属 组 ID 

除了 在 口令 文件 中 对 一 个 登录 名 指定 一 个 组 ID 外 ， 大 多 数 UNIX 系统 版 本 还 允许 一 个 用 户 
属于 另外 一 些 组 。 这 一 功能 是 从 4.2BSD 开始 的 ， 它 允许 一 个 用 户 属于 多 至 16 个 其 他 的 组 。 登 录 
时 ， 读 文件 /etc/grouP， 寻 找 列 有 该 用 户 作为 其 成 员 的 前 16 个 记录 项 就 可 以 得 到 该 用 户 的 附 
属 组 ID (supplementary group ID)。 在 下 一 章 将 说 明 ，POSIX 要 求 系统 至 少 应 支持 8 个 附属 组 ， 
实际 上 大 多 数 系统 至 少 支持 16 个 附属 组 。 


1.9 信号 


信和 号 (signal) 用 于 通知 进程 发 生 了 某 种 情况 。 例 如 ， 若 某 一 进程 执行 除法 操作 ， 其 除数 为 0， 
则 将 名 为 SIGFPE〈 浮 点 异常 ) 的 信号 发 送 给 该 进程 。 进 程 有 以 下 3 种 处 理 信 号 的 方式 。 

(D 忽略 信号 。 有 些 信号 表示 硬件 异常 ， 例 如 ， 除 以 0 或 访问 进程 地 址 空间 以 外 的 存储 单元 
等 ， 因 为 这 些 异 常 产 生 的 后 果 不 确定 ， 所 以 不 推荐 使 用 这 种 处 理 方式 。 

(2) 按 系 统 默认 方式 处 理 。 对 于 除数 为 0， 系 统 默认 方式 是 终止 该 进程 。 

(3) 提供 一 个 函数 ， 信 和 号 发 生 时 调用 该 函数 ， 这 被 称 为 捕捉 该 信号 。 通 过 提供 自 编 的 函数 ， 
我 们 就 能 知道 什么 时 候 产生 了 信号， 并 按期 望 的 方式 处 理 它 。 
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很 多 情况 都 会 产生 信和 号。 终端 键盘 上 有 两 种 产生 信和 号 的 方法 ， 分 别称 为 中 断 键 Cinterrupt key, 
通常 是 Delete ER Ctrl+C) 和 退出 键 (quit key， 通 常 是 Ctrl+\)， 它 们 被 用 于 中 断 当 前 运行 的 进程 。 
另 一 种 产生 信号 的 方法 是 调用 kill 函数 。 在 一 个 进程 中 调用 此 函数 就 可 向 另 一 个 进程 发 送 一 个 信 
号 。 当 然 这 样 做 也 有 些 限制 ; 当 向 一 个 进程 发 送信 号 时 ， 我 们 必须 是 那个 进程 的 所 有 者 或 者 是 超级 
HP: 


"aX 


回忆 一 下 基本 的 shell 实例 〈 见 图 1-7 程序 )。 如 果 调 用 此 程序 ， 然 后 按 下 中 断 键 ， 则 执行 此 
程序 的 进程 终止 。 产 生 这 种 后 果 的 原因 是 :对 于 此 信和 号 (SIGINT) 的 系统 默认 动作 是 终止 进程 。 
该 进程 没有 告诉 系统 内 核 应 该 如 何 处 理 此 信号， 所 以 系统 按 默认 方式 终止 该 进程 。 

为 了 能 捕捉 到 此 信号 , 程序 需要 调用 signal 函数 ,其 中 指定 了 当 产 生 SIGINT 信号 时 
要 调用 的 函数 的 名 字 。 函 数 名 为 sig_int， 当 其 被 调用 时 ， 只 是 打印 一 条 消息 ， 然 后 打印 
一 个 新 提示 符 。 在 图 1-7 程序 中 添加 了 11 行 ， 构 成 了 图 1-10 程序 (添加 的 11 行 以 行 首 的 + 
号 指示 )。 


#include "apue.h" 
#include <sys/wait.h> 


+ static void sig int(int); /* our signal-catching function */ 
+ 
int 
main (void) 
{ 
char buf(MAXLINE); /* from apue.h */ 
pid t pid; 
int status; 


+ if (signal (SIGINT, sig int) == SIG ERR) 
+ err sys("signal error"); 
n 
printf("$5£ "); /* print prompt (printf requires $$ to print %) */ 
while (fgets(buf, MAXLINE, stdin) != NULL) { 
if (buf[strlen(buf) - 1] == 'Mn!) 


buf[strlen(buf) ~ 1] = 0; /* replace newline with null */ 


if ((pid = fork()) < 0) ( 
err sys("fork error"); 

) else if (pid == 0) ( /* child */ 
execip(buf, buf, (char *)0); 
err ret("couldn't execute: $s", buf); 
exit(127); 

} 


/* parent */ 
if ((pid = waitpid(pid, &status, 0)) < 0) 
err sys("waitpid error"); 
printf ("3% "); 
} 
exití(0); 
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* 

* void 

* sig int(int signo) 

+ { 

+ printf ("interrupt\n%% "); 
+} 


图 1-10 ”从 标准 输入 读 命令 并 执行 
因为 大 多 数 重要 的 应 用 程序 都 对 信号 进行 处 理 ， 所 以 第 10 章 将 详细 介绍 信和 号 。 a 


1.10 时间 值 


历史 上 ，UNIX 系统 使 用 过 两 种 不 同 的 时 间 值 。 

(1) 日 历时 间 。 该 值 是 自 协 调 世界 时 〈Coordinated Universal Time, UTC) 1970 ££ 1 H 1 H 
00:00:00 这 个 特定 时 间 以 来 所 经 过 的 秒 数 累计 值 (早期 的 手册 称 UTC 为 格林 尼 治 标准 时 间 )。 这 
些 时 间 值 可 用 于 记录 文件 最 近 一 次 的 修改 时 间 等 。 

系统 基本 数据 类 型 cime t 用 于 保存 这 种 时 间 值 。 

(2) 进程 时 间 。 也 被 称 为 CPU 时 间 ， 用 以 度量 进程 使 用 的 中 央 处 理 器 资源 。 进 程 时 间 以 时 钟 
滴答 计算 。 每 秒 钟 曾经 取 为 50、60 或 100 个 时 钟 滴答 。 

系统 基本 数据 类 型 clock c 保存 这 种 时 间 值 。2.5.4 节 将 说 明 如 何 用 syscont 函数 得 到 每 
秒 的 时 钟 滴答 数 。 

当 度 量 一 个 进程 的 执行 时 间 时 〈 克 3.9 节 )，UNIX 系统 为 一 个 进程 维护 了 3 个 进程 时 间 值 : 

e 时 钟 时 间 ; 

。 用 户 CPU 时 间 ; 

© 系统 CPU NIA. 

时 钟 时 间 又 称 为 墙 上 时 钟 时 间 (wall clock time)， 它 是 进程 运行 的 时 间 总 量 ， 其 值 与 系统 
中 同时 运行 的 进程 数 有 关 。 每 当 在 本 书 中 提 到 时 钟 时 间 时 ， 都 是 在 系统 中 没有 其 他 活动 时 进行 
度量 的 。 

FAP CPU 时 间 是 执行 用 户 指令 所 用 的 时 间 量 。 系 统 CPU 时 间 是 为 该 进程 执行 内 核 程 序 所 经 
历 的 时 间 。 例 如 ， 每 当 一 个 进程 执行 一 个 系统 服务 时 ， 如 read 或 write， 在 内 核 内 执行 该 服务 
所 花费 的 时 间 就 计 入 该 进程 的 系统 CPU 时 间 。 用 户 CPU 时 间 和 系统 CPU 时 间 之 和 常 被 称 为 CPU 
时 间 。 

要 取得 任 一 进程 的 时 钟 时 间 、 用 户 时 间 和 系统 时 间 是 很 容易 的 一 一 只 要 执行 命令 time(1)， 
其 参数 是 要 度量 其 执行 时 间 的 命令 ， 例 如 : 


$ ed /usr/include 

$ time -p grep POSIX SOURCE */*.h > /dav/nuli 
real om0.81is 

user om0.11s 

sys om0.07s 


time 命令 的 输出 格式 与 所 使 用 的 shel 有 关 ， 其 原因 是 某 些 shell 并 不 运行 /usr/bin/time,， m 
是 使 用 一 个 内 置 函 数 测量 命令 运行 所 使 用 的 时 间 。 
8.17 节 将 说 明 一 个 运行 进程 如 何 取得 这 3 个 时 间 。 关 于 时 间 和 日 期 的 一 般 说 明 见 6.10 节 。 
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1.11 系统 调用 和 库 函 数 


所 有 的 操作 系统 都 提供 多 种 服务 的 入 口 点 ， 由 此 程序 向 内 核 请 求 服务 。 各 种 版 本 的 UNIX 实 
现 都 提供 良好 定义 、 数 量 有 限 、 直 接 进 入 内 核 的 入 口 点 , 这 些 入 口 点 被 称 为 系统 调用 (system call, 
见 图 1-1)。Research UNIX 系统 第 7 版 提供 了 约 50 个 系统 调用 ，4.4BSD 提供 了 约 110 个 系统 调 
用 ， 而 SVR4 则 提供 了 约 120 个 系统 调用 。 具 体 数 字 在 不 同 操作 系统 版 本 中 会 不 同 ， 新 近 的 大 多 
数 系统 大 大 增加 了 支持 的 系统 调用 的 个 数 。Linux 3.2.0 提供 了 380 个 系统 调用 ，FreeBSD 8.0 提供 
的 系统 调用 超过 450 个 。 

系统 调用 接口 总 是 在 《UNIX 程序 员 手 册 》 的 第 2 部 分 中 说 明 ， 是 用 C 语言 定义 的 ， 与 具体 
系统 如 何 调用 一 个 系统 调用 的 实现 技术 无 关 。 这 与 很 多 早期 的 操作 系统 不 同 ， 那 些 系统 按 传 统 方 
式 用 机 器 的 汇编 语言 定义 内 核 入 口 点 。 

UNIX 所 使 用 的 技术 是 为 每 个 系统 调用 在 标准 C 库 中 设置 一 个 具有 同样 名 字 的 函数 。 用 户 进 
程 用 标准 C 调用 序列 来 调用 这 些 函 数 ， 然 后 ， 函 数 又 用 系统 所 要 求 的 技术 调用 相应 的 内 核 服 务 。 
例如 ， 函 数 可 将 一 个 或 多 个 C 参数 送 入 通用 寄存 器 ,然后 执行 某 个 产生 软 中 断 进入 内 核 的 机 器 指 
令 。 从 应 用 角度 考虑 ， 可 将 系统 调用 视 为 C 函数 。 

(UNIX 程序 员 手 册 》 的 第 3 部 分 定义 了 程序 员 可 以 使 用 的 通用 库 函 数 。 虽 然 这些 函 数 可 能 会 
调用 一 个 或 多 个 内 核 的 系统 调用 ， 但 是 它们 并 不 是 内 核 的 入 口 点 。 例 如 ，printf 函数 会 调用 
write 系统 调用 以 输出 一 个 字符 串 ， 但 函数 strcpy〔 复 制 一 个 字符 囊 ) 和 atoi (将 ASCI 转 
换 为 整数 ) 并 不 使 用 任何 内 核 的 系统 调用 。 

从 实现 者 的 角度 来 看 ， 系 统 调用 和 库 函 数 之 间 有 根本 的 区 别 ， 但 从 用 户 角度 来 看 ， 其 区 别 并 
不 重要 。 在 本 书 中 ， 系 统 调用 和 库 函 数 都 以 C 函数 的 形式 出 现 ， 两 者 都 为 应 用 程序 提供 服务 。 但 
是 ， 我 们 应 当 理 解 ， 如 果 希 望 的 话 ， 我 们 可 以 替换 库 函 数 ， 但 是 系统 调用 通常 是 不 能 被 替换 的 。 

以 存储 空间 分 配 函 数 malloc 为 例 。 有 多 种 方法 可 以 进行 存储 空间 分 配 及 与 其 相关 的 无 用 空 
闻 回 收 操作 《〈 最 佳 适应 、 首 次 适应 等 )， 并 不 存在 对 所 有 程序 都 最 优 的 一 种 技术 。UNIX 系统 调用 
中 处 理 存储 空间 分 配 的 是 sbrk(2)， 它 不 是 一 个 通用 的 存储 器 管理 器 。 它 按 指定 字 节 数 增加 或 减 
少 进程 地 址 空间 。 如 何 管理 该 地 址 空间 却 取决 于 进程 。 存 储 空间 分 配 函 数 malloc(3) 实 现 一 种 特 
定 类 型 的 分 配 。 如 果 我 们 不 喜欢 其 操作 方式 ， 则 可 以 定义 自己 的 malloc 函数 ， 它 很 可 能 将 使 用 
sbrk 系统 调用 。 事 实 上 ， 有 很 多 软件 包 ， 它 们 使 用 sork 系统 调用 实现 自己 的 存储 空间 分 配 算 
Sk. Bd 1-11 显示 了 应 用 程序 、malloc 函数 以 及 sbrk 系统 调用 之 间 的 关系 。 

从 中 可 见 ， 两 者 职责 不 同 ， 内 核 中 的 系统 调用 分 配 一 块 空间 给 进程 ， 而 库 函 数 malloc 则 在 
用 户 层次 管理 这 - 空间 。 

另 一 个 可 说 明 系 统 调用 和 库 函 数 之 间 差 别 的 例子 是 ，UNIX 系统 提供 的 判断 当前 时 间 和 日 期 
的 接口 。 一 些 操 作 系 统 分 别提 供 了 一 个 返回 时 间 的 系统 调用 和 另 一 个 返回 日 期 的 系统 调用 。 任 何 
特殊 的 处 理 ， 例 如 正常 时 制 和 夏令 时 之 间 的 转换 ， 由 内 核 处 理 或 要 求人 为 干预 。UNIX 系统 则 不 
同 ， 它 只 提供 一 个 系统 调用 ， 该 系统 调用 返回 自 协调 世界 时 1970 年 1 月 1 日 零 时 这 个 特定 时 间 
以 来 所 经 过 的 秒 数 。 对 该 值 的 任何 解释 ， 例 如 将 其 变换 成 人 们 可 读 的 、 适 用 于 本 地 时 区 的 时 间 和 
日 期 ， 都 留 给 用 户 进程 进行 处 理 。 在 标准 C 库 中 ， 提 供 了 若干 例 程 以 处 理 大 多 数 情 况 。 这 些 库 函 
数 处 理 各 种 细节 ， 如 各 种 夏令 时 算法 等 。 

应 用 程序 既 可 以 调用 系统 调用 也 可 以 调用 库 函 数 。 很 多 库 函 数 则 会 调用 系统 调用 。 图 1-12 È 
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示 了 这 种 差别 。 





图 1-11 malloc 函数 和 sbrk 系统 调用 图 1-12 C 库 函数 和 系统 调用 之 间 的 差别 
系统 调用 和 库 函 数 之 间 的 另 一 个 差别 是 : 系统 调用 通常 提供 一 种 最 小 接口 ， 而 库 函 数 通常 提 
供 比 较 复杂 的 功能 。 我 们 从 sbrk 系统 调用 和 malloc 库 函 数 之 间 的 差别 中 可 以 看 到 这 一 点 。 当 
我 们 比较 不 带 缓冲 的 VO 函数 〈 见 第 3 章 ) 和 标准 VO 函数 〈 见 第 5 章 ) 时 ， 还 将 看 到 这 种 差别 。 
进程 控制 系统 调用 (fork、exec 和 wait) 通常 由 用 户 应 用 程序 直接 调用 (请 回忆 图 1-7 
中 的 基本 shell)。 但 是 为 了 简化 某 些 常见 的 情况 ，UNIX 系统 也 提供 了 一 些 库 函 数 ， 如 system 
和 popen。8.13 节 将 说 明 system 函数 的 一 种 实现 ， 它 使 用 基本 的 进程 控制 系统 调用 。10.18 节 
还 将 强化 这 一 实例 以 正确 地 处 理 信 和 号。 
为 使 读者 了 解 大 多 数 程序 员 应 用 的 UNIX 系统 接口 ， 我 们 不 得 不 既 说 明 系 统 调 用 ， 又 介绍 某 
些 库 函 数 。 例如 ,车 只 描述 sork 系统 调用 ,那么 就 会 忽略 很 多 应 用 程序 使 用 的 malloc 库 函 数 。 
本 书 除了 必须 要 区 分 两 者 时 ， 对 系统 调用 和 库 函 数 都 使 用 函数 unction) 这 一 术语 来 表示 。 


1.12 ”小结 
本 章 快速 浏览 了 UNIX 系统 。 说 明了 某 些 以 后 会 多 次 用 到 的 基本 术语 , 介绍 了 一 些小 的 UNIX 
程序 实例 。 读 者 可 以 从 中 大 概 了 解 到 本 书 其 余部 分 将 要 介绍 的 内 容 。 


下 一 章 是 关于 UNIX 系统 的 标准 , 以 及 这 方面 的 工作 对 当前 系统 的 影响 。 标准 , 特别 是 ISOC 
标准 和 POSIX.1 标准 ， 将 影响 本 书 的 余下 部 分 。 


习题 


1.1 在 系统 上 验证 ， 除 根 目 录 外 ， 目 录 . 和 . .是 不 同 的 。 
12 “分 析 图 1-6 程序 的 输出 ， 说 明 进 程 ID 为 852 和 853 的 进程 发 生 了 什么 情况 ? 


习题 19 


在 1.7 di'h, perror 的 参数 是 用 ISO C 的 属性 const 定义 的 ， 而 strerror 的 整 型 参数 
没有 用 此 属性 定义 ， 为 什么 ? 

若 日 历时 间 存 放 在 带 符号 的 32 位 整 型 数 中 ， 那 么 到 哪 一 年 它 将 溢出 ?可 以 用 什么 方法 扩展 

洲 出 浮 点 数 ? 采用 的 策略 是 否 与 现 有 的 应 用 相 兼 容 ? 

车 进程 时 间 存 放 在 带 符号 的 32 位 整 型 数 中 ， 而 且 每 秒 为 100 时 钟 滴答 ， 那 么 经 过 多 少 天 后 

该 时 间 值 将 会 溢出 ? 
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2.1 引言 


人 们 在 UNIX 编程 环境 和 C 程序 设计 语言 的 标准 化 方面 已 经 做 了 很 多 工作 。 虽然 UNIX 应 用 
程序 在 不 同 的 UNIX 操作 系统 版 本 之 间 进 行 移植 相当 容易 ， 但 是 20 世纪 80 年 代 UNIX 版 本 种 类 
的 剧 增 以 及 它们 之 间 差 别 的 扩大 ， 导 致 很 多 大 用 户 〈 如 美国 政府 ) 呼吁 对 其 进行 标准 化 。 

本 章 首先 回顾 过 去 近 25 年 人 们 在 UNIX 标准 化 方面 做 出 的 种 种 努力 ， 然 后 讨论 这 些 UNIX 
编程 标准 对 本 书 所 列举 的 各 种 UNIX 操作 系统 实现 的 影响 。 所 有 标准 化 工作 的 一 个 重要 部 分 是 对 
每 种 实现 必须 定义 的 各 种 限制 进行 说 明 ， 所 以 我 们 将 说 明 这 些 限制 以 及 确定 它们 值 的 各 种 方法 。 
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22.1 ISOC 


1989 年 下 半年 ，C 程序 设计 语言 的 ANSI 标准 X3.159-1989 得 到 批准 。 此 标准 被 也 采纳 为 国 
际 标准 ISO/IEC 9899:1990. ANSI 是 美国 国家 标准 学 会 C American National Standards Institute) 的 
缩写 ， 它 是 国际 标准 化 组 织 〈International Organization for Standardization, ISO) 中 代表 美国 的 成 

员 。IEC 是 国际 电子 技术 委员 会 〈Intemational Electrotechnical Commission) 的 缩写 。 

ISO C 标准 现在 由 ISOAEC 的 C 程 序 设 计 语 言 国际 标准 工作 组 维护 和 开发 ,该 工作 组 称 为 ISO/ 
IEC JTC1/SC22/WG14, 简称 WG14. ISO C 标准 的 意图 是 提供 C 程序 的 可 移植 性 ， 使 其 能 适合 于 
大 量 不 同 的 操作 系统 ， 而 不 只 是 适合 UNIX 系统 。 此 标准 不 仅 定义 了 C 程序 设计 语言 的 语法 和 语 
义 ， 还 定义 了 其 标准 库 (参见 ISO 1999 第 7 BH; Plauger[1992]: Kernighan 和 Ritchie[1988] 中 的 附 
录 B)。 因 为 所 有 现今 的 UNIX 系统 (如 本 书 介绍 的 几 个 UNIX 系统 》 都 提供 C 标准 中 定义 的 库 
函数 ， 所 以 该 标准 库 非常 重要 。 

1999 f£, ISO C 标准 被 更 新 ， 并 被 批准 为 ISO/IEC 9899:1999, 它 显著 改善 了 对 进行 数值 处 理 
的 应 用 软件 的 支持 。 除 了 对 某 些 函数 原型 增加 了 关键 字 restrict 外 , 这 种 改变 并 不 影响 本 书 中 
描述 的 POSIX HO. restrict 关键 字 告诉 编译 器 ， 哪 些 指针 引用 是 可 以 优化 的 ， 其 方法 是 指出 
指针 引用 的 对 象 在 函数 中 只 通过 该 指针 进行 访问 。 

1999 年 以 来 ， 已 经 公布 了 3 个 技术 勘误 来 修正 ISO C 标准 中 的 错误 ， 分 别 在 2001 年 、2004 
年 和 2007 年 公布 。 如 同 大 多 数 标准 一 样 ， 在 批准 标准 和 修改 软件 使 其 符合 标准 两 者 之 问 有 一 段 
时 间 延 迟 。 随 着 供应 商 编译 系统 的 不 断 演 化 ， 对 最 新 ISO C 标准 的 支持 也 就 越 来 越 多 。 
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i gcc 对 ISO C 标准 1999 版 本 符合 程度 的 总 结 可 和 参见 http://www.gnu.org/c99status. 
”html， 虽 然 C 标准 已 经 在 2011 年 更 新 ， 但 由 于 其 他 标准 还 没有 进行 相应 的 更 新 ， 因 此 在 本 书 中 
我 们 还 是 活用 1999 年 的 版 本 。 


按照 该 标准 定义 的 各 个 头 文件 〈 见 图 2-1) 可 将 ISO C 库 分 成 24 个 区 。POSIX.I 标准 包括 这 些 
头 文件 以 及 另外 一 些 头 文件 。 从 图 2-1 中 可 以 看 出 , 所 有 这 些 头 文件 在 4 种 UNIX 实现 (FreeBSD 8.0. 
Linux 3.2.0. Mac OS X 10.6.8 和 Solaris 10) 中 都 支持 。 本 章 后 面 将 对 这 4 种 UNIX 实现 进行 说 明 。 


ISO C 头 文 件 依赖 于 操作 系统 所 配置 的 C 编译 器 的 版 本 。FreeBSD 8.0 配置 了 gcc 4.2.1 版 ， 
Solaris 10 配置 了 gcc 3.4.3 版 ( 以 及 Sun Studio 自 带 的 C 编译 器 )，Ubuntu 12.04 ( Linux 3.2.0 ) 配 
| 置 了 gcc4.6.3 版 ，Mac OS X 10.6.8 配置 了 gcc 4.0.1 和 42.1 版 。 


头 文 件 FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 


«assert.h» 验证 程序 断言 

复数 算术 运算 支持 
字符 分 类 和 映射 支持 

出 错 码 (1.7 节 ) 

浮 点 环境 

浮 点 常量 及 特性 
整 型 格式 变换 

赋值 、 关 系 及 一 元 操作 符 宏 


«complex,.h» 
«ctype.h» 
«errno.h» 
<fenv.h> 
<float.h> 
<inttypes .h> 
«iso646.h» 


<limits.h> 
<locale.h> 
«math.h» 

<setjmp.h> 
<signal.h> 
<stdarg.h> 


<stdbool.h> 


«stddef.h» 
<stdint.h> 
<stdio.h> 
<stdlib.h> 
<string.h> 
<tgmath.h> 
<time.h> 
«wchar.h»? 
<wetype.h> 
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图 2-1 
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ISO C 标准 定义 的 头 文件 


实现 常量 (2.5 节 ) 

本 地 化 类 别 及 相关 定义 
数学 函数 、 类 型 声明 及 常量 
非 局 部 goto (7.10 节 ) 
信号 〈 第 10 章 ) 

可 变 长 度 参数 表 
布尔 类 型 和 值 

标准 定义 

Xn) 

标准 WO 库 GB 53) 

实用 函数 

FR RRE 
通用 类 型 数学 宏 
时 间 和 日 期 〈6.10 节 ) 

扩充 的 多 字 节 和 宽 字 符 支持 
宽 字符 分 类 和 映射 支持 





2.2.2 IEEE POSIX 


POSIX 是 一 -个 最 初 由 IEEE (Institute of Electrical and Electronics Engineers， 电 气 和 电子 工程 
师 学 会 ) 制订 的 标准 族 。 POSIX 指 的 是 可 移植 操作 系统 接口 (Portable Operating System Interface). 
它 原来 指 的 只 是 IEEE 标准 1003.1-1988〈 操 作 系统 接口 )， 后 来 则 扩展 成 包括 很 多 标记 为 1003 的 
标准 及 标准 草案 ， 如 shell 和 实用 程序 〈1003.2)。 

与 本 书 相关 的 是 1003.1 操作 系统 接口 标准 , 该 标准 的 目的 是 提升 应 用 程序 在 各 种 UNIX 系统 
环境 之 间 的 可 移植 性 。 它 定义 了 “符合 POSIX H” (POSIX compliant) 操作 系统 必须 提供 的 各 
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种 服务 。 该 标准 已 被 很 多 计算 机 制造 商 采 用 。 虽 然 1003.1 标准 是 以 UNIX 操作 系统 为 基础 的 ， 但 
是 它 并 不 限于 UNIX fI UNIX 类 的 系统 。 确 实 ， 有 些 提供 专 有 操作 系统 的 制造 商 也 声称 他 们 的 系 
SEE POSIX (同时 还 保留 所 有 专 有 功能 )。 

由 于 1003.1 标准 说 明了 一 个 接口 (interface〉 而 不 是 一 种 实现 (implementation)， 所 以 并 不 
区 分 系统 调用 和 库 函 数 。 所 有 在 标准 中 的 例 程 都 被 称 为 函数 。 

标准 是 不 断 演进 的 ，1003.1 标准 也 不 例外 。 该 标准 的 1988 版 ， 即 IEEE 标准 1003.1-1988 经 
修改 后 递交 给 ISO， 它 没有 增加 新 的 接口 或 功能 ， 但 修订 了 文本 。 最 终 的 文档 作为 IEEE 标准 
1003.1-1990 正式 出 版 [IEEE 1990]， 这 也 就 是 国际 标准 ISO/IEC 9945-1:1990。 该 标准 通常 称 为 
POSIX.1， 本 书 将 使 用 此 术语 来 表示 不 同 版 本 的 标准 。 

IEEE 1003.1 工作 组 此 后 继续 对 这 一 标准 做 了 更 多 修改 。1996 年 ， 该 标准 的 修订 版 发 布 ， 它 
包括 了 1003.1-1990. 1003.1b-1993 实时 扩展 标准 以 及 被 称 为 pthreads 的 多 线程 编程 接口 (POSIX 
线程 )， 这 就 是 国际 标准 ISO/IEC 9945-1:1996。1999 年 出 版 了 IEEE 标准 1003.1d-1999， 其 中 增加 
了 更 多 实时 接口 。 一 年 后 ， 出 版 了 IEEE 标准 1003.1j-2000 和 1003.1q-2000， 前 者 包含 了 更 多 实时 
接口 ， 后 者 增加 了 标准 在 事件 跟踪 方面 的 扩展 。 

2001 年 的 1003.1 版 本 与 以 前 各 版 本 有 较 大 的 差别 ， 它 组 合 了 多 个 1003.1 的 修正 、1003.2 标 
准 以 及 Single UNIX Specificaiton (SUS) 第 2 版 的 若干 部 分 〈 对 于 SUS， 后 面 将 进行 更 多 说 明 )， 
这 形成 了 IEEE 标准 1003.1-2001， 它 包括 下 列 几 个 标准 。 

e ISO/IEC 9945-1 (IEEE 标准 1003.1-1996)， 包 括 
e IEEE 标准 1003.1-1990 
4 IEEE 标准 1003.1b-1993〈 实 时 扩展 》 

+ IEEE 标准 1003.1c-1995 (pthreads) 

e IEEE 标准 1003.1i-1995〔 实 时 技术 勘误 表 ) 
IEEE P1003.1a 草案 (系统 接口 修正 ) 

IEEE 标准 1003.1d-1999 〈 高 级 实时 扩展 ) 
IEEE 标准 1003.1j-2000 (更 多 高 级 实时 扩展 ) 
IEEE 标准 1003.19-2000 (RERO 

部 分 IEEE 标准 1003.1g-2000〔 协 议 无 关 接 口 》 
ISO/IEC 9945-2 (IEEE 标准 1003.2-1993) 
IEEE P1003.2b 草案 〈shell 及 实用 程序 的 修正 ) 
IEEE 标准 1003.2d-1994( 批 处 理 扩 展 ) 

Single UNIX Specification 第 2 版 基本 说 明 ， 包 括 
e 系统 接口 定义 ， 第 5 发 行 版 

e 命令 和 实用 程序 ， 第 5 发 行 版 

e 系统 接口 和 头 文件 ， 第 5 发行 版 

e 开放 组 技术 标准 ， 网 络 服 务 ，5.2 发 行 版 

e ISO/IEC 9899-1999, C 程序 设计 语言 

2004 ££, POSIX.1 说 明 随 着 技术 勘误 得 到 更 新 , 2008 年 做 了 更 多 综合 的 改动 并 作为 基本 说 明 
的 第 7 发 行 版 发 布 ，ISO 在 2008 年 底 批准 了 这 个 版 本 并 在 2009 年 进行 发 布 ， 即 国际 标准 
ISO/IEC9945:2009。 该 标准 基于 其 他 几 个 标准 。 

。 IEEE 标准 1003.1，2004 年 版 。 


© 开放 组 织 技术 标准 ，2006， 扩 展 API 集 ， 第 1 一 4 部 分 。 
e ISO/IEC 9899:1999， 包 含 勘误 表 。 
图 2-2、 图 2-3 以 及 图 2-4 BAT POSIX. 指定 的 必需 的 和 可 选 的 头 文件 。 因 为 POSIX.1 包 


«aio.h» 
«cpio.h» 
«dirent.h» 
<dlfcn.h> 
«fentl.h» 
<fnmatch.h> 
<glob.h> 
«grp.h» 
«iconv.h» 
<langinfo. 
<monetary. 
<netdb.h> 
<nl_types.h> 
<poll.h> 
<pthread.h> 
<pwd.h> 
<regex.h> 
<sched.h> 
<semaphore.h> 
<strings.h> 
<tar.h> 
<termios.h> 
<unistd.h> 
<wordexp.h> 
<arpa/inet.h> 
<net/if.h> 
<netinet/in.h> 
<netinet/tcp.h> 
<sys/mman.h> 
<sys/select.h> 
«sys/socket.h» 
<sys/stat.h> 
<sys/statvfs.h> 
<sys/times.h> 
<sys/types.h> 
<sys/un.h> 
«sys/utsname.h» 
«sys/wait.h» 


FreeBSD Linux 
8.0 3.2.0 


Mac OS X 


10.6.8 Solaris 10 





图 2-2 POSIX 标准 定义 的 必需 的 头 文件 


2.2 UNIX 标准 化 23 


* f ISO C 标准 库 函 数 ， 所 以 它 还 需要 图 2-1 中 列 出 的 各 个 头 文件 。 这 4 张 图 中 的 表 也 总 结 了 本 
书 所 讨论 的 4 种 UNIX 系统 实现 所 包含 的 头 文件 。 


头 文件 


异步 VO 

cpio 归档 值 

自 录 项 (422 节 ) 

动态 链接 

文件 控制 (3.14 节 》 
文件 名 匹配 类 型 

路 径 名 模式 匹配 与 生成 
组 文件 (6.4 节 ) 
代码 集 变 换 实 用 程序 


消息 类 

投票 函数 〈14.4.2 节 ) 

线程 〈 第 11 章 、 第 12 章 ) 
口令 文件 (6.2 i) 

正则 表达 式 

执行 调度 

信和 号 量 

字符 串 操 作 

tar 归档 值 

终端 WO (第 18 SO 

符号 常量 

学 扩充 类 型 

因特网 定义 (第 16 章 ) 

套 接 字 本 地 接口 (第 16 章 ) 
因特网 地 址 族 (16.3 节 ) 
传输 控制 协议 定义 

存储 管理 声明 

select MAM (14.4.1 节 》 
套 接 字 接 口 (第 16 章 ) 
文件 状态 (第 4 章 ) 

文件 系统 信息 

进程 时 间 (8.17 节 ) 

基本 系统 数据 类 型 (2.8 节 ) 
UNIX 域 套 接 字 定 义 (17.2 W) 
RAZ (690) 

进程 控制 (8.6 5) 


本 书 中 描述 了 POSIX.12008 年 版 ， 其 接口 分 成 两 部 分 : 必需 部 分 和 可 选 部 分 。 可 选 接口 部 分 
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按 功 能 又 进一步 分 成 40 个 功能 分 区 。 图 2-5 按 各 自 的 选项 码 总 结 了 包含 未 弃 用 的 编程 接口 。 选项 
码 是 能 够 表述 标准 的 2 一 3 个 字母 的 缩写 ， 用 以 标识 属于 各 个 功能 分 区 的 接口 ， 其 中 的 接口 依赖 
于 特定 选项 的 支持 。 很 多 选项 处 理 实时 扩展 。 


i o ns Linux Mac OS X ; . 


«fmtmsg. "emtusg:ho- | 消息 显示 结构 
«ftw.h» 文件 树 漫游 〈4.22 35) 
<libgen.h> 

<ndbm.h> 


<search.h> 


<syslog.h> 系统 出 错 日 志 记 录 (13.4 节 ) 


<utmpx. h> 用 户 账户 数据 库 
<sys/ipc.h> 

<sys/msg.h> XSI 消息 队列 (15.7 节 ) 
<sys/resource.h> 资源 操作 (7.11 节 ) 
<sys/sem.h> XSI 信号 量 (15.8 节 》 
<sys/shm.h> XSI 共享 存储 (15.9 节 ) 
<sys/time.h> 时 间 类 型 
«sys/uio.h» XX VO 操作 (14.6 $5) 


图 2-3 POSIX 标准 定义 的 XSI 可 选 头 文件 


X a Linux Mac OS X 
<mqueue.h> | RE 
<spawn.h> 实时 spawn 接口 


图 2-4 POSIX 标准 定义 的 可 选 头 文件 


选项 码 | SUS 强制 的 符号 常量 
Foal CAN AUN UENMD 


POSIX ADVISORY INFO 建议 性 信息 〔 实 时) 
_POSIX_CPUTIME 进程 CPU 时 间 时 钟 〈 实 时 ) 
POSIX FSYNC 文件 同步 
.POSIX IPV6 IPv6 接口 
POSIX MEMLOCK 进程 存储 区 加 锁 ‘实时 ) 
_POSIX_MEMLOCK_RANGE 存储 区 域 加 锁 实时) 
_POSIX_MONOTONIC_CLOCK 单调 时 钟 ( 实 时 ) 

POSIX MESSAGE, PASSING 消息 传送 (实时 ) 

_ STDC IEC 559 _ IEC 60559 浮 点 选项 

.POSIX PRIORITIZED IO 优先 输入 和 输出 

POSIX PRIORITIZED SCHEDULING 进程 调度 〈 实 时 ) 

POSIX THREAD ROBUST PRIO INHERIT | 健壮 的 互 斥 量 优先 权 继 承 〈 实 时 ) 
POSIX THREAD ROBUST PRIO PROTECT | 健壮 的 互 斥 量 优先 权 保 护 《〈 实 时 ) 
.POSIX RAW SOCKETS 原始 套 接 字 

.POSIX SHARED MEMORY OBJECTS 共享 存储 对 象 〈 实 时 》) 

POSIX SYNCHRONIZED, IO 同步 输入 和 输出 〈 实 时 ) 

POSIX SPAWN PU CSET) 

.POSIX SPORADIC SERVER 进程 阵 发 性 服务 器 (实时 )》 
_POSIX_THREAD CPUTIME 线程 CPU 时 间 时 钟 ( 实 时) 
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.POSIX THREAD PRIO INHERIT 非 键 壮 的 互 斥 量 优先 权 继 承 〈 实 时 ) 
POSIX THREAD PRIO PROTECT 非 键 壮 的 互 斥 量 优先 权 保护 《实时 ) 
.POSIX THREAD PRIORITY SCHEDULING | 线程 执行 调度 (实时 } 

.POSIX THREAD ATTR STACKADDR 线程 栈 地 址 属性 

POSIX THREAD PROCESS SHARED 线程 进程 共享 同步 


.POSIX THREAD SPORADIC SERVER 线程 阵 发 性 服务 器 (实时) 
POSIX THREAD ATTR STACKSIZE 线程 栈 长 度 属性 

POSIX TYPED MEMORY OBJECTS 类 型 存储 对 象 实 时 ) 
_XOPEN_UNIX X/Open 扩充 接口 





图 2-5 POSIX.1 可 选 接口 组 和 选项 码 

POSIX.1 没有 包括 超级 用 户 〈supeniser) 这 样 的 概念 ， 代 之 以 规定 某 些 操作 要 求 “ 适 当 的 优 
ER”, POSIX. 将 此 术语 的 含义 留 由 具体 实现 进行 解释 。 某 些 符合 美国 国防 部 安全 性 指南 要 求 的 
UNIX 系统 具有 很 多 不 同 的 安全 级 。 本 书 仍 使 用 传统 的 UNIX 术语 ， 并 指明 要 求 超级 用 户 特 权 的 
操作 。 

经 过 20 多 年 的 工作 ， 相 关 标 准 已 经 成 熟 稳定 。POSIX.1 标准 现在 由 Austin Group 开放 工作 组 
(http://www.opengroup.org/austin) 维护 。 为 了 保证 它们 仍然 有 价值 ， 仍 需 经 常 对 这 些 
标准 进行 更 新 或 再 确认 。 


2.2.3 Single UNIX Specification 


Single UNIX Specification (SUS, ¥— UNIX 规范 ) 是 POSIX.1 标准 的 一 个 超 集 ， 它 定义 了 
一 些 附加 接口 扩展 了 POSIX.1 规范 提供 的 功能 , POSIX.1 相当 于 Single UNIX Specification 中 的 基 
本 规范 部 分 。 

POSIX.1 中 的 X/Open 系统 接口 (X/Open System Interface, XSI) 选项 描述 了 可 选 的 接口 ， 
也 定义 了 遵循 XSI (XSI conforming) 的 实现 必须 支持 POSIX.1 的 哪些 可 选 部 分 。 这 些 必须 支 
持 的 部 分 包括 : 文件 同步 、 线 程 栈 地 址 和 长 度 属性 、 线 程 进程 共享 同步 以 及 _XOPEN_UNIX ff 
号 常量 (在 图 2-5 中 它们 被 加 上 “SUS 强制 的 ”的 标记 )。 只 有 遵循 XSI 的 实现 才能 称 为 UNIX 


Open Group 拥有 UNIX 商标 , 他 们 使 用 Single UNIX Specification 定义 了 一 系列 接口 。 一 个 系 
统 要 想 称 为 UNIX 系统 ， 其 实现 必须 支持 这 些 接口 。UNIX 系统 供应 商 必 须 以 文件 形式 提供 符合 
' 性 声明 ， 并 通过 验证 符合 性 的 测试 ， 才 能 得 到 使 用 UNIX 商标 的 许可 证 。 


有 些 接口 在 遵循 XSI 的 系统 中 是 可 选 的 ， 这 些 接口 根据 功能 被 分 成 若干 选 项 组 (option 
group)， 具 体 如 下 。 

e 加 密 : 由 符号 常量 XOPEN CRYPE 标记 。 

e 实时 : 由 符号 常量 XOPEN_REALTIME 标记 。 

e 高 级 实时 。 

。 实时 线程 : 由 符号 常量 XOPEN REALTIME THREADS 标记 。 

。 高 级 实时 线程 。 

Single UNIX Specification 是 Open Group 的 出 版 物 ， 而 Open Group 是 由 两 个 工业 社团 
X/Open 和 开放 系统 软件 基金 会 (Open System Software Foundation, OSF) 在 1996 年 合并 构成 
的 。X/Open 过 去 出 版 了 X/Open Portability Guide (X/Open 可 移植 性 指南 )， 它 采用 了 才干 特定 
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28] 标准 ， 填 补 了 其 他 标准 缺失 功能 的 空白 。 这 些 指南 的 目的 是 改善 应 用 的 可 移植 性 ， 使 其 不 仅仅 
3 符合 已 发 布 的 标准 。 

X/Open 在 1994 年 发 布 了 Single UNIX Specification 第 1 版 , 因为 它 大 约 包含 了 1170 MEO, 
因此 也 称 为 “Spec 1170”。 它 源 自 通用 开放 软件 环境 (Common Open Software Environment, 
COSE) 的 倡议 ， 该 倡议 的 目标 是 进一步 改善 应 用 程序 在 所 有 UNIX 操作 系统 实现 之 间 的 可 移植 
f£. COSE 的 成 员 包 括 Sun. IBM, HP. Novell/USL 以 及 OSF 等 ， 他 们 的 UNIX 都 包含 了 通用 商 
业 化 应 用 软件 使 用 的 接口 ， 这 较 之 仅仅 赞同 和 支持 标准 前 进 了 一 大 步 。 从 这 些 应 用 软件 的 接口 中 
选 出 的 1170 个 接口 被 包括 在 下 列 标准 中 : X/Open 通用 应 用 环境 (Common Application 
Environment, CAE) 第 4 发行 版 (也 被 称 为 XPG4， 以 表示 它 与 其 前 身 X/Open Portability Guide 
的 历史 关系 )、 系 统 V 接口 定义 (System V Interface Definition, SVID) 第 3 版 Level 1 接口 、OSF 
应 用 环境 规范 (Application Environment Specification, AES) Full Use 接口 。 

1997 年 ，Open Group 发 布 了 Single UNIX Specification 第 2 版 。 新 版 本 增加 了 对 线程 、 实 时 
接口 、64 位 处 理 、 大 文件 以 及 增强 的 多 字 节 字符 处 理 等 功能 的 支持 。 

Single UNIX Specification 第 3 版 (SUSv3) 由 Open Group 在 2001 年 发 布 。SUSv3 的 基本 规 
范 与 IEEE 标准 1003.1-2001 相同 ， 分 成 4 个 部 分 : 基本 定义 、 系 统 接口 、shell 和 实用 程序 以 及 基 
本 理论 。SUSv3 还 包括 X/Open Curses 第 4 发 行 版 第 2 版 , 但 该 规范 并 不 是 POSIX.1 的 组 成 部 分 。 

2002 年 ，ISO 将 IEEE 标准 1003.1-2001 批准 为 国际 标准 ISO/IEC 9945:2002。Open Group 在 
2003 年 再 次 更 新 了 1003.1 标准 ， 包 括 了 技术 方面 的 更 正 。ISO 将 其 批准 为 国际 标准 ISO/TEC 
9945:2003. 2004 年 4 H, Open Group 发 布 了 Single UNIX Specification 第 3 版 2004 年 版 ， 将 更 
多 技术 上 的 更 正 合 并 到 标准 的 正文 中 。 

2008 年 ，Single UNIX Specification 再 次 更 新 , 包括 了 更 正和 新 的 接口 、 移 除 弃 用 的 接口 以 及 将 
一 些 未 来 可 能 被 删除 的 接口 标记 为 弃 用 接口 等 。 另 外, 有 一 些 过 去 被 认为 可 选 的 接口 变 成 必 选 接口 ， 
其 中 包括 异步 JO、 屏障 、 时 钟 选择 、 存 储 映像 文件 、 内 存 保护 、 读 写 锁 、 实 时 信号 、POSIX 信号 
量 、 旋 转 锁 、 线 程 安全 函数 、 线 程 、 超 时 机 制 以 及 时 钟 等 。 最 终 形 成 的 标准 就 是 基本 规范 的 第 7 发 
行 版 , 也 即 POSIX.1-2008. Open Group 把 这 个 版 本 和 X/OPEN Curses 规范 的 更 新 版 打包 , 并 于 2010 
年 作为 Single UNIX Specification 第 4 版 发 布 。 我 们 把 这 个 规范 称 为 SUSv4。 


2.2.4 FIPS 


FIPS 代表 的 是 联邦 信息 处 理 标准 (Federal Information Processing Standard)， 这 一 标准 是 由 美 
国政 府 发 布 的 ， 并 由 美国 政府 用 于 计算 机 系统 的 采购 。FIPS151-1 (1989 年 4 月 ) 基于 IEEE 标准 
1003.1-1988 及 ANSI C 标准 草案 。 此 后 是 FIPS 151-2(1993 年 5 月 ), 它 基于 IEEE 标准 1003.1-1990。 
在 POSIX.1 中 列 为 可 选 的 某 些 功能 ,在 FIPS 151-2 中 是 必需 的 ,所 有 这 些 可 选 功 能 在 POSIX.1-2001 

中 已 成 为 强制 性 要 求 。 

POSIX.1 FIPS 的 作用 是 , 它 要 求 任何 希望 向 美国 政府 销售 符合 POSIX.1 标准 的 计算 机 系统 的 

厂商 都 应 支持 POSIX. 的 某 些 可 选 功能 。 因 为 POSIX.1 FIPS 已经 撤回 ， 所 以 在 本 书 中 我 们 不 再 


2.3 UNIX 系统 实现 


上 一 节 说 明了 3 个 由 各 自 独立 的 组 织 所 制定 的 标准 : ISOC, IEEE POSIX 以 及 Single UNIX 
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Specification。 但 是 ， 标 准 只 是 接口 的 规范 。 这 些 标准 是 如 何 与 现实 世界 相关 连 的 呢 ? 这 些 标 准 
由 厂商 采用 ， 然 后 转变 成 具体 实现 。 本 书 中 我 们 不 仅 对 这 些 标准 感 兴趣 ， 还 对 它们 的 具体 实现 
感 兴趣 。 

Æ McKusick 等 [1996] 的 1.1 节 中 给 出 了 UNIX 系统 家 族 树 的 详细 历史 。UNIX 的 各 种 版 本 和 
变 体 都 起 源 于 在 PDP-11 系统 上 运行 的 UNIX 分 时 系统 第 6 版 (1976 年 ) 和 第 7 版 (1979 4E) GR 
常 称 为 V6 和 V7)。 这 两 个 版 本 是 在 贝尔 实验 室 以 外 首先 得 到 广泛 应 用 的 UNIX 系统 。 从 这 棵 树 
上 演进 出 以 下 3 个 分 支 。 

(1) AT&T 分 支 ， 从 此 引出 了 系统 IH 和 系统 V〔 被 称 为 UNIX 的 商用 版 本 )。 

(2) 加 州 大 学 伯克利 分 校 分 支 ， 从 此 引出 4.xBSD 实现 。 

(3) 由 AT&T 贝尔 实验 室 的 计算 科学 研究 中 心 不 断 开发 的 UNIX 研究 版 本 ， 从 此 引出 UNIX 
分 时 系统 第 8 版 、 第 9 版 ， 终 止 于 1990 年 的 第 10 版 。 


2.3.1] SVR4 


SVR4 (UNIX System V Release 4) 是 AT&T 的 UNIX 系统 实验 室 (UNIX System Laboratories, 
USL， 其 前 身 是 AT&T 的 UNIX Software Operation〉 的 产品 ， 它 将 下 列 系统 的 功能 合并 到 了 一 个 
一 致 的 操作 系统 中 : AT&T UNIX 系统 V 3.2 版 (SVR3.2)、Sun Microsystems 公司 的 SunOS 操作 
系统 、 加 州 大 学 伯克利 分 校 的 4.3BSD 以 及 微软 的 Xenix 系统 (Xenix 是 在 V7 的 基础 上 开发 的 ， 
后 来 又 采纳 了 很 多 系统 V 的 功能 )。 其 源 代码 于 1989 年 后 期 发 布 ， 在 1990 年 开始 向 终端 用 户 提 
供 。SVR4 符合 POSIX 1003.1 标准 和 X/Open XPG3 标准 。 

AT&T 也 出 版 了 系统 V 接口 定义 〈(SVID) [AT&T 1989]. SVID 第 3 版 说 明了 UNIX 系统 要 
达到 SVR4 质量 要 求 必 须 提供 的 功能 。 如 同 POSIX.1 一 样 ，SVID 定义 了 一 个 接口 ， 而 不 是 一 种 
KM. SVID 并 不 区 分 系统 调用 和 库 函 数 。 对 于 一 个 SVR4 的 具体 实现 ， 应 查看 其 参考 手册 ， 以 
了 解 系统 调用 和 库 函 数 的 不 同 之 处 [AT&T 1990e]。 


2.3.2 4.4BSD 


BSD (Berkeley Software Distribution》 是 由 加 州 大 学 伯克利 分 校 的 计算 机 系统 研究 组 (CSRG) W 
究 开 发 和 分 发 的 。4.2BSD F 1983 年 问世 ，4.3BSD 则 于 1986 年 发 布 。 这 两 个 版 本 都 在 VAX 小 型 机 
上 运行 。 它 们 的 下 一 个 版 本 4.3BSD Tahoe 于 1988 年 发 布 ， 在 一 台 称 为 Tahoe 的 小 型 机 上 运行 (Leffler 
等 [1989] 说 明了 4.3BSD Tahoe Mi). FG XA 1990 年 的 4.3BSD Reno 版 ， 它 支持 很 多 POSIX.1 的 功能 。 

最 初 的 BSD 系统 包含 了 AT&T 专 有 的 源 代码 ,它们 需要 AT&T 许可 证 。 为 了 获得 BSD 系统 的 
源 代码 ， 首 先 需 要 持 有 ATAT 的 UNIX 源 代 码 许 可 证 。 这 种 情况 正在 改变 ， 近 几 年 ， 越 来 越 多 的 
AT&T 源 代码 被 替换 成 非 ATAT 源 代码 ， 很 多 添加 到 BSD 系统 上 的 新 功能 也 来 自 于 非 AT&T 方面 。 

1989 年 ， 伯 克利 将 4.3BSD Tahoe 中 很 多 非 AT&T 源 代码 包装 成 BSD 网 络 软 件 1.0 版 ， 并 使 
其 成 为 可 公开 获得 的 软件 。1991 FRAT BSD 网 络 软件 2.0 版 ， 它 是 从 4.3BSD Reno 版 派生 出 
来 的 ， 其 目的 是 使 大 部 分 (如 果 不 是 全 部 的 话 ) 4.4BSD 系统 不 再 受 AT&T 许可 证 的 限制 ， 这 样 ， 
大 家 都 可 以 得 到 源 代码 。 

4.4BSD.Lite 是 CSRG 计划 开发 的 最 后 一 个 发 行 版 。 由 于 与 USL 产生 的 法 律 纠 纷 ， 该 版 本 曾 
一 度 延 迟 推出 。 在 纠纷 解决 后 ,，4.4BSD-Lite 立即 于 1994 年 发 布 ， 并 且 不 再 需要 具有 UNIX 源 代 
码 使 用 许可 证 就 可 以 使 用 它 。1995 年 CSRG 发 布 了 修复 了 bug 的 版 本 。4.4BSD-Lite 第 2 发 行 版 
是 CSRG 的 最 后 一 个 BSD ARA (McKusick 等 [1996] 描 述 了 该 BSD 版 本 )。 
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在 伯克利 所 进行 的 UNIX 开发 工作 是 从 PDP-11 开始 的 ， 然 后 转移 到 VAX 小 型 机 上 ， 接 着 
又 转移 到 工作 站 上 。20 世纪 90 年 代 早 期 ， 伯 克利 得 到 支持 在 广泛 应 用 的 80386 个 人 计算 机 上 
开发 BSD 版 本 ， 结 果 产 生 了 386BSD。 这 一 工作 是 由 Bill Jolitz 完成 的 ， 其 工作 在 1991 年 全 年 
的 Dr Dobb's 期 刊 上 以 每 月 一 篇 文章 连载 发 表 。 其 中 很 多 代码 出 现在 BSD 网 络 软件 2.0 版 中 。 


2.3.3 FreeBSD 


FreeBSD 基 十 4.4BSD-Lite 操作 系统 。 在 加 州 大 学 伯克利 分 校 的 CSRG 决定 终止 其 在 UNIX 
操作 系统 的 BSD 版 本 的 研发 工作 ， 而 且 386BSD 项 目 被 忽视 很 长 时 间 之 后 ， 为 了 继续 坚持 BSD 
系列 ， 形 成 了 FreeBSD 项 目 。 

由 FreeBSD 项 目 产 生 的 所 有 软件 ， 包 括 其 二 进 制 代码 和 源 代 码 ， 都 是 免费 使 用 的 。 为 了 测试 
书 中 的 实例 ， 本 书 选取 了 4 个 操作 系统 ，FreeBSD 8.0 操作 系统 是 其 中 之 一 。 


有 许多 基于 BSD 的 免费 操作 系统 。NetBSD AA ( http://www.netbsd.org) 类 似 于 
”FreeBSD 项 目 ， 但 是 更 注重 不 同 硬件 平台 之 间 的 可 移植 性 。OpenBSD 项 目 (http: //www.openbsd. 
| org) 也 类 似 于 FreeBSD 项 目 ， 但 更 注重 于 安全 性 。 


2.3.4 Linux 


Linux 是 一 种 提供 类 似 于 UNIX 的 丰富 编程 环境 的 操作 系统 ， 在 GNU 公用 许可 证 的 指导 下 ， 
Linux 是 免费 使 用 的 。Linux 的 普及 是 计算 机 产业 中 的 一 道 亮丽 风景 线 。Linux 经 常 是 支持 较 新 硬 
件 的 第 一 个 操作 系统 ， 这 一 点 使 其 引 人 注 目 。 

Linux 是 由 Linus Torvalds 在 1991 年 为 替代 MINIX 而 研发 的 。 一 位 当时 名 不 见 经 传人 物 的 努 
力 掀 起 了 澎 浒 巨 浪 ， 吸 引 了 遍布 全 世界 的 很 多 软件 开发 者 ， 在 使 用 和 不 断 增 强 Linux 方面 自愿 贡 
献 出 了 他 们 大 量 的 时 间 。 

Ubuntu 12.04 的 Linux 分 发 版 本 是 用 以 测试 本 书 实例 的 操作 系统 之 一 。 该 系统 使 用 了 Linux 
操作 系统 3.2.0 版 内 核 。 


2.3.5 Mac OSX 


与 其 以 前 的 版 本 相 比 ，Mac OS X 使 用 了 完全 不 同 的 技术 。 其 核心 操作 系统 称 为 “Darwin”"， 它 
基 十 Mach 内 核 (Accetta 等 [1986])、FreeBSD 操作 系统 以 及 具有 面向 对 象 框 架 的 驱动 和 其 他 内 核 
扩展 的 结合 。Mac OS X 10.5 的 Intel 部 分 已 经 被 验证 为 是 一 个 UNIX 系统 。( 关 于 UNIX 验证 的 更 
多 信息 ， 请 参见 http://www.opengroup.org/certification/idx/UNIX.html)。 

Mac OS X 10.6.8 (Darwin 10.8.0〉 是 用 以 测试 本 书 实例 的 操作 系统 之 一 。 


2.9.6 Solaris 


Solaris 是 由 Sun Microsystems (WA Oracle) 开发 的 UNIX 系统 版 本 。 它 基于 SVR4， 在 超过 
15 年 的 时 间 里 ，Sun Microsystems 的 工程 师 对 其 功能 不 断 增 强 。 它 是 唯一 在 商业 上 取得 成 功 的 
SVR4 后 裔 ， 并 被 正式 验证 为 UNIX 系统 。 

2005 ££, Sun Microsystems 把 Solaris 操作 系统 的 大 部 分 源 代 码 开放 给 公众 , 作为 OpenSolaris 
开放 源 代码 操作 系统 的 一 部 分 ， 试 图 建立 围绕 Solaris 的 外 部 开发 人 员 社 区 。 

Solaris 10 UNIX 操作 系统 也 是 用 以 测试 本 书 实例 的 操作 系统 之 一 。 
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2.3.7 其 他 UNIX 系统 


已 经 通过 验证 的 其 他 UNIX 版 本 包括 : 

e AIX, IBM 版 的 UNIX 系统 ; 

。 HP-UX, HP 版 的 UNIX 系统 ; 

e IRIX, Silicon Graphics 版 的 UNIX 系统 ; 

。 UnixWare，SVR4 派生 的 UNIX 系统 ， 现 由 SCO 销售 。 


2.4 ”标准 和 实现 的 关系 


前 面 提 到 的 各 个 标准 定义 了 任 一 实际 系统 的 子 集 。 本 书 主要 关注 4 种 实际 的 UNIX 系统 ，FreeBSD 
8.0. Linux 3.2.0. Mac OS X 10.6.8 和 Solaris 10。 在 这 4 种 系统 中 ,虽然 只 有 Mac OS X Ail Solaris 10 能 
够 称 自己 是 一 种 UNIX 系统 ,但 是 所 有 这 4 种 系统 都 提供 UNIX 编程 环境 。 因 为 所 有 这 4 种 系统 都 在 
不 同 程度 上 符合 POSIX 标准 ， 所 以 我 们 也 将 重点 关注 POSIX.1 标准 所 要 求 的 功能 ， 并 指出 这 4 种 系 
统 具体 实现 与 POSIX 之 间 的 差别 。 仅 仅 一 个 特定 实现 所 具有 的 功能 和 例 程 会 被 清楚 地 标记 出 来 。 我 
们 还 关注 那些 属于 UNIX 系统 必需 的 ， 但 却 在 符合 POSIX 标准 的 系统 中 是 可 选 的 功能 。 

应 当 看 到 ， 这 些 实现 都 提供 了 对 它们 早期 版 本 (如 SVR3.2 和 4.3BSD) 功能 的 向 后 兼容 性 。 
例如 ，Solaris 对 POSIX.1 规范 中 的 非 阻塞 I/O (0O_NONBLOCK) 以 及 传统 的 系统 V 中 的 方法 
(O0 NDELAYO 都 提供 了 支持 。 本 书 将 只 使 用 POSIX.1 的 功能 , 但 是 也 会 提 及 它 所 替换 的 是 哪 一 种 
非 标准 功能 。 与 此 相 类 似 ，SVR3.2 和 4.3BSD 以 某 种 方法 提供 了 可 靠 的 信号 机 制 ， 这 种 方法 也 有 别 
T POSIX.1 标准 。 第 10 章 将 只 说 明 POSIX.1 的 信号 机 制 。 


2.5 限制 


UNIX 系统 实现 定义 了 很 多 幻 数 和 常量 ， 其 中 有 很 多 已 被 硬 编码 到 程序 中 ， 或 用 特定 的 技术 
确定 。 由 于 大 量 标准 化 工作 的 努力 ， 已 有 若干 种 可 移植 的 方法 用 以 确定 这 些 幻 数 和 具体 实现 定义 
的 限制 。 这 非常 有 助 于 改善 UNIX 环境 下 软件 的 可 移植 性 。 

以 下 两 种 类 型 的 限制 是 必需 的 。 

C) 编译 时 限制 (例如 ， 短 整 型 的 最 大 值 是 什么 ? ) 

(2) 运行 时 限制 (例如 ， 文 件 名 有 多 少 个 字符 ? ) 

编译 时 限制 可 在 头 文件 中 定义 。 程 序 在 编译 时 可 以 包含 这 些 头 文件 。 但 是 ， 运 行 时 限制 则 要 
求 进程 调用 一 个 函数 获得 限制 值 。 

另外 ， 某 些 限 制 在 一 个 给 定 的 实现 中 可 能 是 固定 的 〈 因 此 可 以 静态 地 在 一 个 头 文件 中 定义 )， 而 在 
另 一 个 实现 中 则 可 能 是 变动 的 〈 需 要 有 一 个 运行 时 函数 调用 )。 这 种 类型 限制 的 一 个 例子 是 文件 名 的 最 
大 字符 数 。SVR4 之 前 的 系统 V 由 于 历史 原因 只 允许 文件 名 最 多 包含 14 个 字符 ， 而 源 于 BSD 的 系统 则 
将 此 增加 为 255。 目 前 ， 大 多 数 UNIX 系统 支持 多 文件 系统 类 型 ， 而 每 一 种 类 型 有 它 自己 的 限制 。 文 件 
名 的 最 大 长 度 依赖 于 该 文件 处 于 何 种 文件 系统 ， 例 如 ， 根 文件 系统 中 的 文件 名 长 度 限制 可 能 是 14 个 字 
符 ， 而 在 另 一 个 文件 系统 中 文件 名 长 度 限 制 可 能 是 255 个 字符 ， 这 是 运行 时 限制 的 一 个 例子 。 

为 了 解决 这 类 问题 ， 提 供 了 以 下 3 种 限制 。 

(1) 编译 时 限制 ( 头 文件 )。 
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(2) 与 文件 或 目录 无 关 的 运行 时 限制 (sysconf HR). 

(3) 与 文件 或 目录 有 关 的 运行 时 限制 (pathconf 和 fpathcon£ MR). 

使 事情 变 得 更 加 复杂 的 是 ， 如 果 一 个 特定 的 运行 时 限制 在 一 个 给 定 的 系统 上 并 不 改变 ， 则 可 
将 其 静态 地 定义 在 一 个 头 文件 中 ， 但 是 ， 如 果 没 有 将 其 定义 在 头 文件 中 ， 应 用 程序 就 必须 调用 3 
个 cont 函数 中 的 一 个 〈 我 们 很 快 就 会 对 它们 进行 说 明 )， 以 确定 其 运行 时 的 值 。 
25.1 ISO C 限制 

ISO C 定义 的 所 有 编译 时 限制 都 列 在 头 文件 <l1imits .n> 中 ( 见 图 2-6)。 这 些 限 制 常 量 在 一 - 
个 给 定 系统 中 并 不 会 改变 。 表 中 第 3 列 列 出 了 ISO C 标准 可 接受 的 最 小 值 。 这 用 于 16 位 整 型 的 


系统 , 用 1 的 补 码 表 示 。 第 4 列 列 出 了 32 位 整 型 Linux 系统 的 值 ， 用 2 的 补 码 表示 。 注 意 ， 我 们 
没有 列 出 无 符号 数据 类 型 的 最 小 值 ， 这 些 值 应 该 都 为 0。 在 64 位 系统 中 ， 其 long 整 型 的 最 大 值 


与 表 中 long long 整 型 的 最 大 值 相 匹配 。 
N 
127 















CHAR_BIT char 的 位 数 8 
CHAR MAX char 的 最 大 值 〈 见 后 ) 

CHAR MIN char 的 最 小 值 (Wa) 

SCHAR MAX | signed char 的 最 大 值 127 
SCHAR MIN | signed char 的 最 小 值 —127 
UCHAR MAX | unsigned char 的 最 大 值 255 
INT MAX int 的 最 大 值 32 767 2 147 483 647 
INT MIN int 的 最 小 值 一 32 767 一 2 147 483 648 
UINT_MAX unsigned int 的 最 大 值 65 535 4 294 967 295 
SHRT MAX short 的 最 大 值 32 767 32 767 
SHRT MIN short 的 最 小 值 一 32 767 一 32 768 
USHRT MAX | unsigned short 的 最 大 值 65 535 65 535 
LONG MAX long 的 最 大 值 2 147 483 647 2 147 483 647 
LONG MIN long 的 最 小 值 —2 147 483 647 —2 147 483 648 
ULONG MAX | unsigned long 的 最 大 值 4 294 967 295 4 294 967 295 
LLONG MAX | long long 的 最 大 值 9 223 372 036 854 775 807 | 9223372 036 854 775 807 
LLONG MIN | long long 的 最 小 值 —9223372036854 775 807 | —9 223 372 036 854 775 808 
ULLONG MAX | unsigned long long 的 最 大 值 | 18446 744073 709 551615 | 18446 744 073 709 551 615 


MB LEN MAX | 在 一 个 多 字 节 字符 常量 中 的 最 大 字 书 数 | 1 
2-6 <limits .h> 中 定义 的 整 型 值 大 小 
我 们 将 会 遇 到 的 一 个 区 别 是 系统 是 否 提供 带 符号 或 无 符号 的 的 字符 值 。 从 图 2-6 中 的 第 4 列 可 
以 看 出 ， 该 特定 系统 使 用 带 符号 字符 。 从 图 中 可 以 看 到 CHAR MIN 等 于 SCHAR MIN, CHAR MAX 
等 于 SCHAR_MAX。 如 果 系 统 使 用 无 符号 字符 ， 则 CHAR_MIN 等 于 0，CHAR_MAX 等 于 UCHAR MAX. 
在 头 文件 <float .h> 中 , 对 浮 点 数据 类 型 也 有 类 似 的 一 组 定义 。 如 若 读 者 在 工作 中 涉及 大 量 
浮 点 数据 类 型 ， 则 应 仔细 查看 该 文件 。 
HAR ISO C 标准 规定 了 整 型 数据 类 型 可 接受 的 最 小 值 ， 但 POSIX. 对 C 标准 进行 了 扩充 。 为 了 符 
合 POSIX.1 标准 ， 具 体 实现 必须 支持 INT_MAX 的 最 小 值 为 2147 483 647，INT_MIN 29 2147 483 647, 
UINT_MAX 为 4 294 967 295。 因 为 POSIX.1 要 求 具体 实现 支持 8 位 的 char 类 型 ， 所 以 CHAR_BIT 必 
须 是 8，SCHAR MIN 必须 是 一 128，SCHAR_MAX 必须 是 127, UCHAR MAX 必须 是 255. 
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我 们 会 遇 到 的 另 一 个 ISO C 常量 是 FOPEN MAX, 这 是 具体 实现 保证 可 同时 打开 的 标准 UO 流 
的 最 小 个 数 ， 该 值 在 头 文件 <stdio .h> 中 定义 ， 其 最 小 值 是 8&。POSIX.1 中 的 STREAM MAX (车 
定义 的 话 ) 则 应 与 FOPEN MAX 具有 相同 的 值 。 

ISO C 还 在 <stdio .h> 中 定义 了 常量 TMP_MAX， 这 是 由 tmpnam 函数 产生 的 唯一 文件 名 的 
最 大 个 数 。 关 于 此 常量 我 们 将 在 5.13 节 中 进行 更 多 说 明 。 

虽然 ISO C 定义 了 常量 FILENAME_MAX， 但 我 们 应 避免 使 用 该 常量 ， 因 为 POSIX.1 提供 了 
更 好 的 替代 常量 (NAME MAX 和 PATH_MAX)， 我 们 很 快 就 会 介绍 该 常量 。 

在 图 2-7 F, 我 们 列 出 了 本 书 所 讨论 4 种 平台 上 的 FILENAME MAX. FOPEN MAX 和 TMP_MAX 值 。 





FOPEN MAX | _MAX 
TMP MAX 308 915 n. 238 ta 308 915 776 17 bs 
FILENAME MAX 1 024 4 096 1 024 1 024 


图 2-7 在 各 种 平台 上 ISO 的 限制 


2.5.2 POSIX 限制 


POSIX.1 定义 了 很 多 涉及 操作 系统 实现 限制 的 常量 ， 遗 憾 的 是 ， 这 是 POSIX.1 中 最 令 人 迷惑 
不 解 的 部 分 之 一 。 虽 然 POSIX.1 定义 了 大 量 限 制 和 常量 ,我们 只 关心 与 基本 POSIX.1 接口 有 关 的 
部 分 。 这 些 限 制 和 常量 分 成 下 列 7 类 。 

(1) 数值 限制 ， LONG_BIT、SSIZE_MAX 和 WORD_BIT。 

(2) 最 小 值 ， 图 2-8 中 的 25 个 常量 。 

(3) HAA: POSIX CLOCKRES MIN. 

(4) 运行 时 可 以 增加 的 值 ，CHARCLASS_NAME_MAX、COLL WEIGHTS MAX. LINE MAX. 
NGROUPS MAX 和 RE DUP MAX. 

(5) 运行 时 不 变 值 (可 能 不 确定 ): 图 2-9 中 的 17 个 常量 (加 上 122 节 中 介绍 的 4 个 常量 和 
14.5 节 中 介绍 的 3 个 常量 )。 

(6) 其 他 不 变 值 : NL ARGMAX. NL MSGMAX. NL SETMAX 和 NL_TEXTMAX. 

(7) 路 径 名 可 变 值 ; FILESIZEBITS、LINK_MAX、MAX_CANON、MAX INPUT、NAMFE, MAX, 
PATH MAX. PIPE BUF 和 SYMLINK MAX. 

在 这 些 限制 和 常量 中 ， 某 些 可 能 定义 在 <1imits.h> 中 ， 其 余 的 则 按 具 体 条 件 可 定义 、 可 不 
定义 。 在 2.5.4 节 中 说 明 sysconf. pathconf 和 fpathconf 函数 时 ， 我 们 将 描述 可 定义 或 可 
不 定义 的 限制 和 常量 。 在 图 2-8 中 ， 我 们 列 出 了 25 个 最 小 值 。 

这 些 最 小 值 是 不 变 的 一 一 它们 并 不 随 系统 而 改变 。 它 们 指定 了 这 些 特征 最 具 约 束 性 的 值 。 一 
个 符合 POSIX.1 的 实现 应 当 提 供 至 少 这 样 大 的 值 。 这 就 是 为 什么 将 它们 称 为 最 小 值 ， 虽 然 它 们 的 
名 字 都 包含 了 MAX。 另 外 ， 为 了 保证 可 移植 性 ， 一 个 严格 符合 POSIX 标准 的 应 用 程序 不 应 要 求 
更 大 的 值 。 我 们 将 在 本 书 的 适当 章节 说 明 每 一 个 常量 的 含义 。 


一 个 严格 符合 (strictly conforming ) POSIX 的 应 用 区 别 于 一 个 刚刚 符合 POSIX ( merely POSIX 
confirming ) 的 应 用 。 符 合 POSIX 的 应 用 只 使 用 在 IEEE 1003.1-2001 中 定义 的 接口 。 严 格 罕 合 POSIX 
的 应 用 满足 更 多 的 限制 ， 例 如 ， 不 依赖 于 POSIX 未 定义 的 行为 、 不 使 用 其 任何 已 弃 用 的 接口 以 及 

“不 要 求 所 使 用 的 常量 值 大 于 图 2-8 中 所 列 出 的 最 小 值 。 
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_POSIX_ARG_MAX exec 函数 的 参数 长 度 
POSIX CHILD MAX 每 个 实际 用 户 ID 的 子 进 程 数 
POSIX DELAYTIMER MAX | 定时 器 最 大 超 限 运行 次 数 
POSIX HOST NAME MAX | gethostname 函数 返回 的 主机 名 长 度 
POSIX, LINK MAX 至 一 个 文件 的 链接 数 
.POSIX LOGIN NAME MAX | 登录 名 的 长 度 | 
POSIX MAX CANON 终端 规范 输入 队列 的 字 节 数 
POSIX MAX INPUT 终端 输入 队列 的 可 用 空间 
_POSIX_NAME_MAX 文件 名 中 的 字 节 数 ， 不 包括 终止 null 字 节 
POSIX NGROUPS MAX 每 个 进程 同时 添加 的 组 ID 数 
POSIX OPEN MAX 每 个 进程 的 打开 文件 数 
POSIX PATH MAX 路 径 名 中 的 字 节 数 ， 包 括 终止 null 字 节 
POSIX PIPE BUF 能 原子 地 写 到 一 个 管道 中 的 字 节 数 

当 使 用 间隔 表示 法 \{m, n\} 时 , regexec 和 regcomp 函数 允许 
OU 的 可 本 正则 表达 式 重复 发 生 次 类 UTE 
POSIX RTSIG MAX 为 应 用 预 留 的 实时 信和 号 编号 个 数 
POSIX SEM NSEMS MAX | 一 个 进程 可 以 同时 使 用 的 信号 最 个 数 
_POSIX_SEM_VALUE_MAX | 信号 量 可 持 有 的 值 
POSIX SIGQUEUE MAX 一 个 进程 可 发 送 和 挂 起 的 排队 信号 的 个 数 
POSIX SSIZE MAX 能 存在 ssize tX SP 
POSIX STREAM MAX 一 个 进程 能 同时 打开 的 标准 VO 流 数 
POSIX SYMLINK MAX 符号 链接 中 的 字 节 数 
_POSIX_SYMLOOP_MAX 在 解析 路 径 名 时 ， 可 遍历 的 符号 链接 数 
_POSIX_TIMER MAX 每 个 进程 的 定时 器 数目 
POSIX TTY NAME MAX 终端 设备 名 长 度 ， 包 括 终 由 null 字 节 
_POSIX_TZNAME_MAX 时 区 名 字 节 数 


图 2-8 <limits.h> 中 的 POSIX.I 最 小 值 

遗憾 的 是 ， 这 些 不 变 最 小 值 中 的 某 一 些 在 实际 应 用 中 太 小 了 。 例 如 ， 目 前 在 大 多 数 UNIX K 
统 中 ,每 个 进程 可 同时 打开 的 文件 数 远 远 超过 20。 另 外 ，POSIX_PATH_MAX 的 最 小 限制 值 为 255, 
这 太 小 了 ， 路 径 名 可 能 会 超过 这 一 限制 。 这 意味 着 在 编译 时 不 能 使 用 _POSIX_OPEN_MAX 和 
_POSIX_PATH_MAX 这 两 个 常量 作为 数组 长 度 。 

图 2-8 中 的 25 个 不 变 最 小 值 的 每 一 个 都 有 一 个 相关 的 实现 值 ， 其 名 字 是 将 图 2-8 中 的 名 字 删 
RATA POSIX 后 构成 的 .没有 _POSIX_ 前缀 的 名 字 用 于 给 定 具体 实现 支持 的 该 不 变 最 小 值 的 实 
际 值 (这 25 个 实现 值 是 本 节 开 始 部 分 所 列 出 的 1. 4. 5. 738: 2 个 是 运行 时 可 以 增加 的 值 、15 
个 是 运行 时 不 变 值 、7 个 是 路 径 名 可 变 值 ， 以 及 数值 SSIZE_MAX)。 问 题 是 并 不 能 确保 所 有 这 25 
个 实现 值 都 在 <1imit .h> 头 文件 中 定义 。 

例如 ， 某 个 特定 值 可 能 不 在 此 头 文件 中 定义 ， 其 理由 是 : 一 个 给 定 进程 的 实际 值 可 能 依 
赖 于 系统 的 存储 总 量 。 如 果 没 有 在 头 文件 中 定义 它们 ， 则 不 能 在 编译 时 使 用 它们 作为 数组 边 
界 。 所 以 ，POSIX.1 提供 了 3 个 运行 时 函数 以 供 调 用 ， 它 们 是 : sysconf、pathconf 以 及 
fpathconf。 使 用 这 3 个 函数 可 以 在 运行 时 得 到 实际 的 实现 值 。 但 是 ， 还 有 一 个 问题 ， 其 中 
某 些 值 由 POSIX.1 定义 为 “可 能 不 确定 的 ”逻辑 上 无 限 的 )， 这 就 意味 着 该 值 没有 实际 上 
限 。 例 如 ， 在 Solaris 中 ,进程 结束 时 注册 可 运行 atexit 的 函数 个 数 仅 受 系统 存储 总 量 的 限 
制 。 所 以 在 Solaris 中 ，ATEXIT_MAX 被 认为 是 不 确定 的 。2.5.5 节 还 将 讨论 运行 时 限制 不 确 
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定 的 问题 。 


最 小 可 接受 值 


ARG_MAX 

ATEXIT MAX 
CHILD MAX 
DELAYTIMER MAX 
HOST. NAME MAX 
LOGIN NAME, MAX 
OPEN. MAX 
PAGESIZE 


exec 函数 族 的 参数 最 大 长 度 

可 用 atexit 函数 登记 的 最 大 函数 个 数 
每 个 实际 用 户 ID 的 子 进 程 最 大 个 数 
定时 器 最 大 超 限 运 行 次 数 
gethostname 返回 的 主机 名 长 度 
登录 名 最 大 长 度 

赋予 新 建文 件 描 述 符 的 最 大 值 +1 

系统 内 存 页 大 小 《以 字 节 为 单位 ) 


— 


.POSIX ARG MAX 
32 
.POSIX CHILD MAX 


. POSIX OPEN MAX 
1 


POSIX DELAYTIMER MAX 
.POSIX, HOST NAME MAX 
.POSIX, LOGIN NAME MAX 


为 应 用 程序 预 留 的 实时 信号 的 最 大 个 数 

一 个 进程 可 使 用 的 信号 量 最 大 个 数 
信号 量 的 最 大 值 

一 个 进程 可 排队 信和 号 的 最 大 个 数 

一 个 进程 一 次 可 打开 的 标准 VO 流 的 最 大 个 数 
路 径 解 析 过 程 中 可 访问 的 符号 链接 数 

一 个 进程 的 定时 器 最 大 个 数 

终端 设备 名 长 度 ， 其 中 包括 终止 的 null 字 节 
时 区 名 的 字 节 数 


2-9 <limits.h> 中 的 POSIX.1 运行 时 不 变 值 


RTSIG_MRX 
SEM_NSEMS_MAX 
SEM_VALUE_MAX 
SIGQUEUE_MAX 
STREAM MAX 
SYMLOOP MAX 
TIMER MAX 
TTY NAME MAX 
TZNAME MAX 


POSIX RTSIG MAX 
.POSIX SEM NSEMS, MAX 
.POSIX SEM VALUE MAX 
POSIX, SIGQUEUE, MAX 
.POSIX STREAM MAX 
POSIX SYMLOOP MAX 
POSIX TIMER MAX 
POSIX, TTY NAME MAX 
.POSIX, TZNAME MAX 





2.5.3 XSI 限制 


XSI 定义 了 代表 实现 限制 的 几 个 常量 。 

(1) 最 小 值 ， 图 2-10 中 列 出 的 5 个 常量 。 

(2) 运行 时 不 变 值 (可 能 不 确定 ): IOV MAX 和 PAGE_SIZE。 

图 2-10 列 出 了 最 小 值 。 最 后 两 个 常量 值 说 明了 POSIX.1 最 小 值 太 小 的 情况 ， 根 据 推测 这 可 
能 是 考虑 到 了 嵌入 式 POSIX.1 实现 。 为 此 ，Single UNIX Specification 为 符合 XSI 的 系统 增加 了 有 具 


有 较 大 最 小 值 的 符号 。 


NL LANGMAX 在 LANG 环境 变量 中 最 大 字 节 数 

NZERO 默认 进程 优先 级 

readv 或 writev 可 使 用 的 最 多 iovec 结构 个 数 
文件 名 中 的 字 节 数 

路 径 名 中 的 字 节 数 


2-10 <1Limits.h> 中 的 XSI 最 小 值 
2.5.4 Hj sysconf. pathconf 和 fpathconf 


我 们 已 列 出 了 实现 必须 支持 的 各 种 最 小 值 ， 但 是 怎样 才能 找到 一 个 特定 系统 实际 支持 的 限制 
值 呢 ? 正如 前 面 提 到 的 ， 某 些 限 制 值 在 编译 时 是 可 用 的 ， 而 另外 一 些 则 必须 在 运行 时 确定 。 我 们 
也 曾 提 及 某 些 限制 值 在 一 个 给 定 的 系统 中 可 能 是 不 会 更 改 的 ， 而 其 他 限制 值 可 能 会 更 改 ， 因 为 它 
们 与 文件 和 目录 相关 联 。 运 行 时 限制 可 调用 下 面 3 个 函数 之 一 获得 。 


_XOPEN_IOV_MAX 
 XOPEN, NAME, MAX 
 XOPEN PATH MAX 
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Kinclude «unistd.h» 
long sysconf(int name); 
long pathconf (const char *pathname, int name); 


log fpathconf(int fd, int name); 





所 有 函数 返回 值 : 着 成 功 ， 返 回 相 应 值 ， 若 出 错 ， 返 回 -1〈 见 后 》 


后 面 两 个 函数 的 差别 是 : 一 个 用 路 径 名 作为 其 参数 ， 另 一 个 则 取 文 件 描述 符 作 为 参数 。 

图 2-11 中 列 出 了 sysconf 函数 所 使 用 的 name 参数 , 它 用 于 标识 系统 限制 。 以 _SC_ 开 始 的 常量 用 
作 标 识 运行 时 限制 的 sysconf 参数 。 图 2-12 WHT pathconf 和 £pathcon£ 函数 为 标识 系统 限制 
所 使 用 的 name 参数 。 以 _PC_ 开 始 的 常量 用 作 标 识 运行 时 限制 的 pathconf 或 fpathconf BR. 

我 们 需要 更 详细 地 讨论 一 下 这 3 个 函数 不 同 的 返回 值 。 

(1) WÈ name 参数 并 不 是 一 个 合适 的 常量 , 这 3 个 函数 都 返回 一 !:， 并 把 errno 置 为 EINVAL。 
图 2-11 和 图 2-12 的 第 3 列 给 出 了 我 们 在 整 本 书 中 将 要 涉及 的 限制 常量 。 

(2) 有 些 name 会 返回 一 个 变量 值 (返回 值 之 0) 或 者 提示 该 值 是 不 确定 的 。 不 确定 的 值 通过 
返回 一 1 来 体现 ， 而 不 改变 errno 的 值 。 
























exec 函数 的 参数 最 大 长 度 〈 字 节 ) 


























ARG MAX .SC, ARG MAX 





ATEXIT MAX 可 用 atexit 函数 登记 的 最 大 函数 个 数 _SC_ATEXIT_MAX 
CHILD_MAX 每 个 实际 几 户 ID 的 最 大 进程 数 .SC CHILD MAX 
时 钟 滴答 / 秒 每 秒 时钟 滴 答 数 _SC_CLK_TCK 





在 本 地 定义 文件 中 可 以 赋予 LC_COLLATE 顺序 关 
键 字 项 的 最 大 权重 数 

定时 器 最 大 超 限 运行 次 数 

gethostname 函数 返回 的 主机 名 最 大 长 度 

readv 或 writev 函数 可 以 使 用 最 多 的 iovec 结 
构 的 个 数 


COLL WEIGHTS MAX .SC COLL WEIGHTS MAX 











DELAYTIMER MAX 
HOST NAME MAX 
IOV MAX 


.SC DELAYTIMER MAX 
.SC HOST NAME MAX 
.SC IOV MAX 














LINE MAX 实用 程序 输入 行 的 最 大 长 度 _SC_LINE_MAX 

LOGIN NAME MAX 登录 名 的 最 大 长 度 .SC LOGIN NAME MAX 
NGROUPS MAX 每 个 进程 同时 添加 的 最 大 进程 组 ID 数 .SC NGROUPS MAX 
OPEN MAX 每 个 进程 最 大 打开 文件 数 _SC_OPEN_MAX 








系统 存储 页 长 度 〈 字 节 数 ) 

系统 存储 页 长 度 〈 字 节 数 ) 

当 使 用 间隔 表示 法 \{m, n\i 时， 函数 regexec 和 
regcomp 允许 的 基本 正则 表达 式 重复 发 生 次 数 


PAGESI ZE 
PAGE SIZE 
RE DUP MAX 


.SC PAGESIZE 
.SC PAGE SIZE 
.SC RE DUP MAX 



























RTSIG MAX 为 应 用 程序 预 留 的 实时 信号 的 最 大 个 数 _SC_RTSIG_MAX 

SEM NSEMS MAX 一 个 进程 可 使 用 的 信号 量 最 大 个 数 .SC SEM NSEMS MAX 
SEM VALUE, MAX 信和 号 量 的 最 大 值 SC SEM VALUE MAX 
SIGQUEUE MAX 一 个 进程 可 排队 信和 号 的 最 大 个 数 _SC_SIGQUEUE_MAX 





STREAM_MAX .SC, STREAM MAX 


—h SC STREAM MAX 进程 在 任意 给 定时 刻 标 准 1/0 
流 的 最 大 个 数 。 如 果 定 义 ， 必 须 与 FOPEN_MAX AHEHE 





















TZNAME MAX 


SYMLOOP MAX 在 解析 路 径 名 时 ， 可 遍历 的 符号 链接 数 _SC_SYMLOOP_MRX 
TIMER MAX 每 个 进程 的 最 大 定时 器 个 数 .SC TIMER MAX 
TTY NAME MAX 终端 设备 名 长 度 ， 包 括 终止 null 字 节 _SC_TTY_NAME MAX 












时 区 名 中 的 最 大 字 节 数 
2-11 对 sysconf 的 限制 及 name 参数 


.SC, TZNAME MAX 
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以 带 符号 整 型 值 表示 在 指定 目 
录 中 允许 的 普通 文件 最 大 长 度 所 
需 的 最 小 位 bit》 数 






FILESIZEBITS 





.PC FILESIZEBRITS 





































LINK MAX 文件 链接 计数 的 最 大 值 .PC LINK MAX 
MAX CANON 终端 规范 输入 队列 的 最 大 字 节 数 | PC MAX CANON 
MAX INPUT 终端 输入 队列 可 用 空间 的 字 节 数 | ^ PC MAX INPUT 





文件 名 的 最 大 字 节 数 〈 不 包括 
终止 null 字 节 ) 

相对 路 径 名 的 最 大 字 节 数 ， 包 
括 终 止 null 字 节 
能 原子 地 写 到 管道 的 最 大 字 节 数 
AC fF ST TR] ER DF AE RE E 
符号 链接 的 字 节 数 


2-12 对 pathconf 和 fpathconf 的 限制 及 name 参数 


(3) SC CLK TCK 的 返回 值 是 每 秒 的 时 钟 滴答 数 ， 用 于 times 函数 的 返回 值 (8.17 节 )。 

对 于 pathconf 的 参数 pathname 和 fpathconf 的 参数 应 有 很 多 限制 。 如 果 不 满足 其 中 任 
何 一 个 限制 ， 则 结果 是 未 定义 的 。 

(1) PC MAX CANON 和 _PC_MAX_INPUT 引用 的 文件 必须 是 终端 文件 。 

(2) PC LINK MAX 和 _PC_TIMESTAMP_RESOLUTION 引用 的 文件 可 以 是 文件 或 目录 。 如 
果 是 目录 ， 则 返回 值 用 于 目录 本 身 ， 而 不 用 于 目录 内 的 文件 名 项 。 

(3) PC FILESIZEBITS Wi PC NAME MAX 引用 的 文件 必须 是 目录 ， 返 回 值 用 于 该 目录 中 
的 文件 名 。 

(4) PC, PATH MAX 引用 的 文件 必须 是 目录 。 当 所 指定 的 目录 是 工作 目录 时 ， 返 回 值 是 相对 
路 径 名 的 最 大 长 度 《 遗 憾 的 是 ， 这 不 是 我 们 想 要 知道 的 一 个 绝对 路 径 名 的 实际 最 大 长 度 ， 我 们 将 
在 2.5.5 节 中 再 次 回 到 这 一 问题 上 来 )。 

(5) PC PIPE BUF 引用 的 文件 必须 是 管道 、FIFO 或 目录 。 在 管道 或 FIFO 情况 下 ， 返 回 
值 是 对 所 引用 的 管道 或 FIFO 的 限制 值 。 对 于 目录 ， 返 回 值 是 对 在 该 目录 中 创建 的 任 一 FIFO 的 
限制 值 。 

(6) PC SYMLINK MAX 引用 的 文件 必须 是 目录 。 返 回 值 是 该 目录 中 符号 链接 可 包含 字符 串 
的 最 大 长 度 。 


NAME MAX .PC NAME MAX 








PATH MAX .PC PATH MAX 









PIPE BUF 
.POSIX TIMESTAMP RESOLUTION 
SYMLINK MAX 


.PC PIPE BUF 
.PC TIMESTAMP RESOLUTION 
.PC SYMLINK MAX 









2-13 中 所 示 的 awk(1) 程 序 构建 了 一 个 C 程序 ， 它 打印 各 pathconf 和 sysconf 符号 的 值 。 


#!/usr/bin/awk -Ë 
BEGIN { 
printf("finclude \"apue.h\"\n"} 
printf{"#include <errno.h>\n") 
printf("#include <limits.h>\n") 
printf{'"\n") 
printf("static void pr sysconf(char *, int);\n") 
printf("static void pr pathconf(char *, char *, int);Mn") 
printf ("Vn") 
printf ("int\n") 
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printf("main(int argc, char *argv[]) \n") 
printf ("{\n"} 
printf("\tif (argc != 2)\n") 
printf ("“\t\terr_quit(\"usage: a.out <dirname>\") ;\n\n") 
FS="\t+" 
while (getline <"sysconf.sym" > 0) { 
printf ("#ifdef ts\n", $1) 
printf ("\tprintf (\"ts defined to be t%ld\\n\", (long) %s+0};\n", $1, $1) 
printf ("#telse\n") 
printf ("\tprintf(\"no symbol for %s\\n\")7\n", $1) 
printf ("#endif\n") 
printf ("ifdef ts\n", $2) 
printf ("\tpr_sysconf(\"%s =\", &s);Mn", $1, $2) 
printf ("#else\n") 
print£("\tprint£(\"no symbol for $s\\n\");\n", $2) 
printf ("#endif\n") 
} 
close ("sysconf.sym") 
while (getline <"pathconf.sym" > 0) { 
printf ("#ifdef ts\n", $1) 
printf ("\tprintf(\"%s defined to be %%ld\\n\", (long) %s+0);\n", $1, $1) 
printf ("#else\n") 
printf ("\tprintf£(\"no symbol for ts\\n\");\n", $1) 
printf ("#endif\n") 
printf ("#ifdef %s\n", $2) 
printf£("\tpr_pathconf(\"%s =\", argv[1], $s);Mn", $1, $2) 
printf ("#else\n") 
printf£("\tprintf£(\"no symbol for %s\\n\")7\n", $2) 
printf ("#endif\n") 


close ("pathconf.sym") 
exit 


END { 
printf ("\texit (0);\n") 
printf ("}\n\n") 
printf("static voidMn") 
printf("pr sysconf(char *mesg, int name) Xn") 
printf("(Mn") 
printf("Ntlong val;\n\n") 
printf ("\tfputs(mesg, stdout);VMn") 
printf ("\terrno = 0;\n") 
printf ("\tif ({val = sysconf(name)) < 0) {\n"} 
printf("\t\tif (errno != 0) {\n"} 
printf("\t\t\tif (errno == EINVAL) \n") 
printf ("\t\t\t\tfputs(\" (not supported) \\n\", stdout) 7\n") 
printf ("\t\t\telse\n") 
printf ("\t\t\t\terr_sys(\"sysconf error\");\n") 
printf("NtNt) else {\n"} 
printf ("\t\t\tf£puts(\" (no limit)\\n\", stdout) ; Mn") 
printf("NtNt) Mn") 
printf("Nt) else (Mn") 
printf("NtNtprintf(X" %%ld\\n\", val);\n") 
printf ("Nt) Mn") 
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printf (")]XnVMn") 

printf ("static voidMn") 

printf("pr pathconf(char *mesg, char *path, int name) \n") 
printf ("(Mn"] 

printf("Ntlong val; Mn") 

printf ("Xn") 

printf("Ntfputs(mesg, stdout) ;\n") 

printf ("\terrno = 0;\n") 

printf("Ntif ((val = patheonf (path, name)) < 0) {\n"} 
printf("\t\tif {errno != 0) {\n"} 

print£("\t\t\tif (errno == EINVAL) \n") 

printf ("\t\t\t\tfputs(\" (not supported) \\n\", stdout); Mn") 
printf ("\t\t\telse\n") 

printf ("\t\t\t\terr_sys(\“pathconf error, path = %%s\", path); Mn") 
printf("NtNt) else {\n"} 

printf ("\t\t\tfputs(\" (no limit) \\n\", stdout) ;\n") 
printf ("\t\t)\n”) 

printf("Nt) else {\n"} 

printf("NtNtprintf(M" $$ld\\n\", val);\n") 

printf ("\t}\n") 

printf ("}\n") 


2-13 WEC 程序 以 打印 所 有 得 到 支持 的 系统 配置 限制 


该 awk 程序 读 两 个 输入 文件 一 一 pathconf .sym 和 sysconfig.sym， 这 两 个 文件 中 包含 
了 用 制 表 符 分 隔 的 限制 各 和 符号 列表 。 并 非 每 种 平台 都 定义 所 有 符号 ， 所 以 围绕 每 个 pathconf 
和 sysconf 调用 ，awk 程序 都 使 用 了 必要 的 #ifdef 语句 。 

例如 ，awk 程序 将 输入 文件 中 类 似 于 下 列 形式 的 行 : 


NAME MAX . PC NAME MAX 
转换 成 下 列 C 代码 : 


#ifdef NAME MAX 
printf("NAME MAX is defined to be %d\n", NAME MAXt0); 
#else 
printf ("no symbol for NAME _MAX\n"); 
#endif 
#ifdef PC NAME MAX 
pr pathconf("NAME MAX =", argv[1], | PC NAME MAX); 
#else 
printf("no symbol for PC NAME MAX\n"); 
#endif 


由 awk 产生 的 C 程序 如 图 2-14 所 示 ， 它 会 打印 所 有 这 些 限 制 ， 并 处 理 未 定义 限制 的 情况 。 


#include "apue.h" 
#include <errno.h> 
#tinclude <limits.h> 





static void pr sysconf(char *, int); 
static void pr_pathconf(char *, char *, int); 


int 
main(int argc, char *argv[]) 
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if (argc != 2) 
err quit("usage: a.out «dirname»"); 


#ifdef ARG MAX 
printf("ARG MAX defined to be %ld\n", (long) ARG _MAX+0); 
Éelse 
printf("no symbol for ARG MAX\n"); 
fendif 
#ifdef SC ARG MAX 
pr sysconf("ARG MAX -", SC ARG MAX); 
#else 
printf("no symbol for SC ARG MAX\n"); 
#endif 


/* similar processing for all the rest of the sysconf symbols... */ 


#ifdef MAX CANON 
printf("MAX CANON defined to be %ld\n", (long)MAX CANON+0) ; 
#felse 
printf("no symbol for MAX_CANON\n"); 
#endif 
#ifdef PC MAX CANON 
pr pathconf("MAX CANON -", argv[i], PC MAX CANON); 
#else 
printf("no symbol for PC MAX CANON\n"); 
itendif 


/* similar processing for all the rest of the pathconf symbols... */ 


exit (0}; 


static void 
pr_sysconf (char *mesg, int name) 
{ 


long val; 


fputs (mesg, stdout); 
errno = 0; 
if ((val = sysconf(name)) < 0) { 
if {errno != 0) { 
if {errno == EINVAL) 
fputs(" (not supported) \n", stdout); 
else 
err sys("sysconf error"); 
} else { 
fputs(" (no limit) \n", stdout); 
} 
} else { 
printf(" $ld\n", val); 


static void 
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pr pathconf(char *mesg, char *path, int name) 


{ 


long val; 


fputs (mesg, stdout); 
errno = 0; 
if ((val = pathconf{path, name)) < 0) { 
if (errno != 0) { 
if (errno == EINVAL) 
fputs(" (not supported) \n", stdout); 
else 
err sys("pathconf error, path = %s", path); 
} else { 
fputs(" (no limit)\n", stdout); 
} 
} else { 
printf(" $1dMn", val); 


2-14 打印 所 有 可 能 的 sysconf fI pathconf 值 
2-15 总 结 了 在 本 书 讨 论 的 4 种 系统 上 图 2-14 所 示 程 序 的 输出 结果 。“ 无 符号 ”项 表示 该 系 


统 没 有 提供 相应 _sc 或 _PC 符号 以 查询 相关 常量 值 。 因 此 ， 该 限制 是 未 定义 的 。 与 此 对 比 ,“ 不 支 
持 ” 项 表示 该 符号 由 系统 定义 ， 但 是 未 被 sysconf 和 pathcon HAORA. “ERA” MERZ 
系统 将 相关 常量 定义 为 无 限制 ， 但 并 不 表示 该 限制 值 可 以 是 无 限 的 ， 它 只 表示 该 限制 值 不 确定 。 





Solaris 10 
FreeBSD 8.0 | Linux 3.2.0 Ve 
n UFS 文件 系统 | Pers 文件 系统 


ARG_MAX 262 144 2 097 152 262 144 2 096 640 2 096 640 
ATEXIT MAX 2 147 483 647 2 147 483 647 无 限制 无 限制 
CHARCLASS, NAME MAX : 2 048 14 14 
CHILD MAX 47 211 8 021 8 021 
时 钟 滴答 / 秒 100 100 
COLL WEIGHTS, MAX 255 

FILESIZEBITS 64 

HOST_NAME_MAX 64 

IOV MAX 

LINE, MAX 

LINK, MAX 

LOGIN NAME MAX 

MAX CANON 

MAX INPUT 

NAME MAX 

NGROUPS MAX 

OPEN MAX 

PAGESIZE 

PAGE SIZE 

PATH MAX 

PIPE BUF 

RE DUP MAX 

STREAM MAX 
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SYMLINK MAX 
SYMLOOP MAX 


TTY NAME MAX 
TZNAME MAX 





2-15 配置 限制 的 实例 


| ZR, 有些 限制 报告 地 并 不 正确 。 例 如 ， 在 Linux 中 ，SYMLOOP_MAX 被 报告 成 无 限制 ， 但 是 
| 检查 源 代 码 后 就 会 发 现 ， 实 际 上 它 在 硬 编码 中 有 限制 值 ， 这 一 限制 将 循环 缺失 的 情况 下 遍历 连续 
”符号 链接 的 数目 限制 为 40 (参阅 £s/namei.c T €) follow link 函 教 )。 

| Linux 中 另 一 个 潜在 的 不 精确 的 来 源 是 pathconf 和 £pathcon£ AARTE C 库 函 数 中 实 
' 现 的 ， 这 些 函数 返回 的 配置 限制 依赖 于 底层 的 文件 系统 类 型 ， 因 此 如 果 你 的 文件 系统 不 被 C AR 
， 知 的 话 ， 函 数 返 回 的 是 一 个 猜测 值 。 


我 们 将 在 4.14 节 中 看 到 ，UFS 是 Berkeley 快速 文件 系统 的 SVR4 实现 ，PCFS 是 Solaris 的 
MS-DOS FAT 文件 系统 的 实现 。 x 


2.5.5 不 人 确定 的 运行 时 限制 


前 面 已 提 及 某 些 限制 值 可 能 是 不 确定 的 。 我 们 遇 到 的 问题 是 ， 如 果 这 些 限 制 值 没 有 在 头 文件 
<1limits.h> 中 定义 ， 那 么 在 编译 时 也 就 不 能 使 用 它们 。 但 是 ， 如 果 它 们 的 值 是 不 确定 的 ， 那 么 
在 运行 时 它们 可 能 也 是 未 定义 的 。 让 我 们 来 观察 两 个 特殊 的 情况 ， 为 一 个 路 径 名 分 配 存 储 区 ， 以 
及 确定 文件 描述 符 的 数目 。 
1. 路径 名 
很 多 程序 需要 为 路 径 名 分 配 存储 区 ， 一 般 来 说 ， 在 编译 时 就 为 其 分 配 了 存储 区 ， 而 且 不 同 的 
as] 程序 使 用 各 种 不 同 的 约 数 〈 其 中 很 少 是 正确 的 ) 作为 数组 长 度 ， 如 256、512、1 024 或 标准 VO 常 
! | € BUFSIZ. 43BSD 头 文件 <sys/param.h> 中 的 常量 MAXPATHLEN 才 是 正确 的 值 ， 但 是 很 多 
421 ,3BSD 应 用 程序 并 未 使 用 它 。 
POSIX.1 试图 用 PATH. MAX 值 来 帮助 我 们 , 但 是 如 果 此 值 是 不 确定 的 , 那么 仍 是 毫 无 帮助 的 。 
图 2-16 程序 是 本 书 用 来 为 路 径 名 动态 分 配 存储 区 的 函数 。 


finclude "apue.h" 
#include <errno.h> 
#include <limits.h> 


#ifdef PATH MAX 

Static long pathmax = PATH_MAX; 
telse 

static long pathmax = 0; 

#fendif 


static long posix_version = 0; 
static long xsi_version = 0; 


/* If PATH_MAX is indeterminate, no guarantee this is adequate */ 
#define PATH MAX GUESS 1024 


char * 
path alloc(size t *sizep) /* also return allocated size, if nonnull */ 
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char *ptr; 
size t size; 


if (posix version -- 0) 
posix version - sysconf( SC VERSION); 


if (xsi version == 0) 
xsi version = sysconf( SC XOPEN VERSION); 


if (pathmax -- 0) | /* first time through */ 
errno - 0; 
if ((pathmax = pathconf("/", PC PATH MAX)) < 0) { 
if (errno == Q0) 
pathmax - PATH MAX GUESS; /* it's indeterminate */ 
else 
err sys("pathconf error for PC PATH MAX"); 
) else | 
pathmax++; /* add one since it's relative to root */ 
} 
} 


/* 
* Before POSIX.1-2001, we aren't guaranteed that PATH_MAX includes 
* the terminating null byte. Same goes for XPG3. 
xy 
if ((posix version < 200112L) && (xsi version < 4)) 
size - pathmax * 1; 
else 
size - pathmax; 


if ((ptr = malloc(size)) == NULL) 
err sys("malloc error for pathname"); 


if (sizep != NULL) 
*sizep = size; 
return (ptr); 


图 2-16 ABR 4% was HAS} Ac lel 

如 果 <Limits .h> 中 定义 了 常量 PATH MAX， 那 么 就 没有 任何 问题 ， 如 果 未 定义 ， 则 需 调 用 
pathconf。 因 为 pathconf 的 返回 值 是 基于 工作 目录 的 相对 路 径 名 的 最 大 长 度 ， 而 工作 目录 是 
其 第 -个 参数 ， 所 以 ， 指 定 根 目录 为 第 一 个 参数 ， 并 将 得 到 的 返回 值 加 1 作为 结果 值 。 如 果 
pathconf 指明 PATH MAX 是 不 确定 的 ， 那 么 我 们 就 只 能 猜测 某 个 值 。 

对 于 PATH MAX 是 否 考 虑 到 在 路 径 名 末尾 有 一 个 null 字 节 这 一 点 ，2001 年 以 前 的 POSIX.1 
版 本 表述 得 并 不 清楚 。 出 于 安全 方面 的 考虑 ， 如 果 操 作 系统 的 实现 符合 某 个 先前 版 本 的 标准 ， 但 
并 不 符合 Single UNIX Specification 的 任何 版 本 《SUS 明确 要 求 在 结尾 处 加 一 个 终止 null 字 节 )， 
则 需要 在 为 路 径 名 分 配 的 存储 量 上 加 1。 

处 理 不 确定 结果 情况 的 正确 方法 与 如 何 使 用 分 配 的 存储 空间 有 关 。 例 如 , 如 果 我 们 为 getcwd 
调用 分 配 存储 空间 (返回 当前 工作 目录 的 绝对 路 径 名 ， 见 4.23 节 )， 但 分 配 到 的 空间 太 小 ， 则 会 
返回 一 个 错误 ， 并 将 errno 设置 为 ERANGE。 然 后 可 调用 realloc 来 增加 分 配 的 空间 ( 见 7.8 
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节 和 习题 4.16) 并 重 试 。 不 断 重 复 此 操作 ， 直 到 getcwd 调用 成 功 执行 。 

2. 最 大 打开 文件 数 

守护 进程 (daemon process, 在 后 台 运 行 且 不 与 终端 相连 接 的 一 种 进程 ) 中 一 个 常见 的 代码 序 
列 是 关闭 所 有 打开 文件 。 某 些 程序 中 有 下 列 形式 的 代码 序列 ， 这 段 程 序 假定 在 <sys /param.h> 
头 文件 中 定义 了 常量 NOFILE。 


#include <sys/param.h>; 


for (i = 0; i < NOFILE; i++) 
close(i); 
另外 一 些 程序 则 使 用 某 些 <stdio .h> 版 本 提供 的 作为 上 限 的 常量 _NFILE。 某 些 程序 则 直接 将 其 
上 限 值 硬 编码 为 20。 但 是 ， 这 些 方法 都 不 是 可 移植 的 。 
我 们 希望 用 POSIX.1 的 OPEN MAX 确定 此 值 以 提高 可 移植 性 , 但 是 如 果 此 值 是 不 确定 的 ， 刘 
仍然 有 问题 ， 如 果 我 们 编写 下 列 代码 ， 


#include <unistd.h> 


for (i = 0; i < sysconf( SC OPEN MAX); i++) 
close (i); 


如 果 OPEN MAX 是 不 确定 的 ， 那 么 for 循环 根本 不 会 执行 ， 因 为 sysconf 将 返回 -1。 在 这 种 情 
况 下 ， 最 好 的 选择 就 是 关闭 所 有 描述 符 直 至 某 个 限制 值 (如 236)。 如 同上 面 的 路 径 名 实例 一 样 ， 
虽然 并 不 能 保证 在 所 有 情况 下 都 能 正确 工作 , 但 这 却 是 我 们 所 能 选择 的 最 好 方法 。 图 2-17 的 程序 
中 使 用 了 这 种 技术 。 

我 们 可 以 耐心 地 调用 close， 直 至 得 到 一 个 出 错 返 回 ， 但 是 从 close (EBADF) 出 错 返 回 
并 不 区 分 无 效 描述 符 和 没有 打开 的 描述 符 。 如 果 使 用 此 技术 ， 而 且 描 述 符 9 未 打开 ， 描 述 符 10 
打开 了 ， 那 么 将 停止 在 9 上， 而 不 会 关闭 10。dup M% (A 3.12 节 ) 在 超过 了 OPEN MAX 时 确 
实 会 返回 一 个 特定 的 出 错 值 ， 但 是 用 复制 一 个 描述 符 两 、 三 百 次 的 方法 来 确定 此 值 是 一 种 非常 极 
端的 方法 。 
#include "apue.h" 


#tinclude <errno.h> 
#include <limits.h> 


#ifdef OPEN MAX 

static long openmax = OPEN MAX; 
#else 

static long openmax = 0; 

#endif 


/* 
* If OPEN MAX is indeterminate, this might be inadequate. 
*/ 

#define OPEN MAX GUESS 256 


long 
open_max (void) 
{ 
if (openmax == 0) ( /* first time through */ 
errno = 0; 
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if ((openmax = sysconf( SC OPEN MAX)) < 0) ( 
if (errno == 0) 
openmax = OPEN MAX GUESS; /* it's indeterminate */ 
else 
err_sys("sysconf error for _SC_OPEN_MAX"); 
) 
} 
return (openmax) ; 


图 2-17 确定 文件 描述 符 个 数 
某 些 实现 返回 LONG_MAX 作为 限制 信 ， 但 这 与 不 限制 其 值 在 效果 上 是 相同 的 。Linux 对 
ATEXIT MAX 所 取 的 限制 值 就 属于 此 种 情况 ( 见 图 2-15)， 这 将 使 程序 的 运行 行为 变 得 非常 糟糕 ， 
因此 并 不 是 一 个 好 方法 。 
例如 ， 我 们 可 以 使 用 Bourne-again shell 的 内 建 命 令 ulimit 来 更 改进 程 可 同时 打开 文件 
的 最 多 个 数 。 如 果 要 将 此 限制 值 设置 为 在 效果 上 是 无 限制 的 ， 那 么 通常 要 求 具有 特权 (超级 
用 户 )。 但 是 ， 一 旦 将 其 值 设置 为 无 穷 大 ，sysconf 就 会 将 LONG_MAX 作为 OPEN_MAX 的 限 
制 值 报告 。 程 序 若 将 此 值 作 为 要 关闭 的 文件 描述 符 数 的 上 限 〈 如 图 2-17 AR) 那么 为 了 试图 
关闭 2 147 483 647 个 文件 描述 符 ， 就 会 浪费 大 量 时 间 ， 实 际 上 其 中 绝 大 多 数 文件 描述 符 并 未 
得 到 使 用 。 
支持 Single UNIX Specification 中 XSI 扩展 的 系统 提供 了 getzLimit(2) 函 数 〈( 见 7.11 节 )。 
它 返 回 一 个 进程 可 以 同时 打开 的 描述 符 的 最 多 个 数 。 使 用 该 函数 ， 我 们 能 够 检测 出 对 于 进程 能 够 
打开 的 文件 数 实际 上 并 没有 设置 上 限 ， 于 是 也 就 避 开 了 这 个 问题 。 
| OPEN MAX 被 POSIX 称 为 运行 时 不 变 值 ， 这 意味 着 在 一 个 进程 的 生命 周期 中 其 值 不 应 发 生 
， 变 化 。 但 是 在 支持 XSI 扩展 的 系统 上 ， 可 以 调用 setrlimitQ)ddk (57.11 355) 更 改 一 个 运 
行进 程 的 OPEN MAX 值 (也 可 用 C shell 的 1imit 或 Bourne shell, Bourne-again shell, Debian 
Almquist 和 Korn shell 的 ulimit 命令 更 改 这 个 值 )。 如 果 系 统 支持 这 种 功能 , 则 可 以 更 改 图 2-17 
中 的 函数 ， 使 得 每 次 调用 此 函数 时 都会 调用 sysconE， 而 不 只 是 在 第 一 次 调用 此 函数 时 调用 


i 
‘ sysconfe 


2.6 选项 


图 2-5 列 出 了 POSIX.1 的 选项 ， 并 且 2.2.3 节 讨论 了 XSI 的 选项 组 。 如 果 我 们 要 编写 可 移植 
的 应 用 程序 ， 而 这 些 程序 可 能 会 依赖 于 这 些 可 选 的 支持 的 功能 ， 那 么 就 需要 一 种 可 移植 的 方法 来 
判断 实现 是 否 支持 一 个 给 定 的 选项 。 

如 同 对 限制 的 处 理 〈 见 2.5 d$) 一 样 ，POSIX.1 定义 了 3 种 处 理 选 项 的 方法 。 

C1) 编译 时 选项 定义 在 <unistd.h> 中 。 

(2) 与 文件 或 目录 无 关 的 运行 时 选项 用 sysconf RARAN . 

(3) 与 文件 或 目录 有 关 的 运行 时 选项 通过 调用 pathconf 或 fpathconf 函数 来 判断 。 

选项 包括 了 图 2-5 中 第 3 列 的 符号 以 及 图 2-19 和 图 2-18 中 的 符号 。 如 果 符 号 常量 未 定义 ， 则 必 
须 使 用 sysconf. pathconf 或 fpathconf 来 判断 是 否 支持 该 选项 。 在 这 种 情况 下 ， 这 些 函 数 的 
name 参数 前 缀 _POSIX 必须 蔡 换 为 sc 或 PC。 对 于 以 _XOPEN 为 前 缀 的 常量 ， 在 构成 name 参数 时 
必须 在 其 前 放置 sc 或 PC。 例 如 ， 若 常量 POSIX RAW THREADS 是 未 定义 的 ， 那 么 就 可 以 将 name 
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参数 设置 为 SC_RAW_THREADS， 并 以 此 调用 syscont 来 判断 该 平台 是 否 支持 POSIX 线程 选项 。 如 
若 常量 XOPEN UNIX 是 未 定义 的 ， 那 么 就 可 以 将 name 参数 设置 为 _ SC_XOPEN_UNIX， 并 以 此 调用 
sysconf KAMIZY ALA ME XSI 扩展 。 

对 于 每 一 个 选项 ， 有 以 下 3 种 可 能 的 平台 支持 状态 。 

(OD 如 果 符 号 常量 没有 定义 或 者 定义 值 为 1， 那 么 该 平台 在 编译 时 并 不 支持 相应 选项 。 但 是 
有 一 种 可 能 , 即 在 已 支持 该 选项 的 新 系统 上 运行 老 的 应 用 时 , 即使 该 选项 在 应 用 编译 时 未 被 支持 ， 
但 如 今 新 系统 运行 时 检查 会 显示 该 选项 已 被 支持 。 

(2) 如 果 符 号 常量 的 定义 值 大 于 0， 那 么 该 平台 支持 相应 选项 。 

(3) 如 果 符 号 常量 的 定义 值 为 0， 则 必须 调用 sysconf. pathconf 或 fpathconf 来 判断 
相应 选项 是 否 受到 支持 。 

2-18 总 结 了 pathconf 和 £pathconf 使 用 的 符号 常量 。 除 了 图 2-5 中 列 出 的 选项 之 外 ， 
图 2-19 总 结 了 其 他 一 些 sysconf 使 用 的 未 弃 用 的 选项 及 它们 的 符号 常量 。 注 意 ， 我 们 省 略 了 与 
实用 命令 相关 的 选项 。 


_POSIX_CHOWN_RESTRICTED | 使 用 chown 是 否 是 受 限 的 _PC_CHOWN_RESTRICTED 
_POSIX_NO_TRUNC 路 径 名 长 于 NAME_MAX 是 否 出 错 _PC_NO_TRUNC 


_POSIX_VDISABLE 若 定义 ， 可 用 此 值 禁用 终端 特殊 字符 _PC_VDISABLE 
_POSIX_ASYNC_IO SAAR SC ET CLA SRE VO _PC_ASYNC_IO 
POSIX PRIO IO XXI SC fits nr AEA SER VO | PC PRIO IO 
POSIX SYNC IO 对 相关 联 的 文件 是 否 可 以 使 用 同步 VO _PC_SYNC_IO 
_POSIX2_SYMLINKS 目录 中 是 否 支 持 符 号 链接 PC 2 SYMLINKS 


图 2-18 pathcont 和 fpathcont 的 选项 及 name 参数 





POSIX ASYNCHRONOUS, IO 此 实现 是 否 支持 POSIX FE VO | |. SC ASYNCHRONOUS. IO 
POSIX BARRIERS 此 实现 是 否 支持 屏障 .SC BARRIERS 

POSIX CLOCK SELECTION 此 实现 是 省 支持 时 钟 选择 .SC CLOCK SELECTION 

POSIX JOB CONTROL 此 实现 是 否 支 持 作 业 控 制 _SC_JOB_CONTROL 
_POSIX_MAPPED_FILES 此 实现 是 否 支 持 存 储 映 像 文件 | SC MAPPED FILES 
_POSIX_MEMORY_PROTECTION 此 实现 是 否 支持 存储 保护 _SC_MEMORY_PROTECTION 
_POSIX_READER_WRITER_LOCKS 此 实现 是 否 支持 读者 - 写 者 锁 | _Sc_READER_WRITER_LOCKS 
_POSIX_REALTIME_SIGNALS 此 实现 是 否 支 持 实时 信和 号 .SC REALTIME SIGNALS 


此 实现 是 答 支 持 保 存 的 设置 
POSIX SAVED IDS 用 户 ID 和 保存 的 设置 组 ID 


POSIX SEMAPHORES 此 实现 是 否 支持 POSIX 信号 量 | _SC_SEMAPHORES 
_POSIX_SHELL 此 实现 是 否 支持 POSIX shell | SC SHELL 

POSIX SPIN LOCKS 此 实现 是 耕 支 持 旋转 锁 .SC SPIN LOCKS 

POSIX THREAD SAFE FUNCTIONS | ”此 实现 是 否 支 持 线程 安全 函数 | SC THREAD, SAFE, FUNCTIONS 
.POSIX THREADS 此 实现 是 否 支 持 线程 _SC_THREADS 
_POSIX_TIMEOUTS eee 支持 基于 超时 的 
POSIX TIMERS ESE SE GS Sc roe SE _SC_TIMERS 
_POSIX_VERSION POSIX.1 版 本 .SC VERSION 
T- 支持 XSI 加 密 可 


zz 


.SC SAVED IDS 


_SC_TIMEOUTS 


_XOPEN_CRYPT _SC_XOPEN_CRYPT 
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.XOPEN REALTIME P uri XSI 实时 选 .8C XOPEN REALTIME 


.XOPEN REALTIME THREADS 二 实现 是 否 支 持 实时 线程 先 .SC XOPEN REÉALTIME THREADS 


= 


_XOPEN_SHM Hace XSI 共享 存 _SC_XOPEN_SHM 


_XOPEN_VERSION XSI 版 本 _SC_XOPEN_VERSION 
2-19 sysconf 的 选项 及 name 参数 

如 同系 统 限 制 一 样 ， 关 于 sysconf. pathconf 和 fpathconf 如 何 处 理 选项 ,有 如 下 几 点 
值得 注意 。 

(D _SC_VERSION 的 返回 值 表 示 标 准 发 布 的 年 (以 4 位 数 表 示 )、 月 (以 2 位 数 表示 )。 
该 值 可 能 是 198808L. 199009L. 199506L 或 表示 该 标准 后 续 版 本 的 其 他 值 。 与 SUSv3 
(POSIX.1 2001 年 版 〉 相 关连 的 值 是 200112L， 与 SUSv4 (POSIX.1 2008 年 版 ) 相关 连 的 值 
是 200809L. 

(2)_SC_XOPEN_VERSION 的 返回 值 表示 系统 支持 的 XSI 版 本 ,与 SUSv3 相关 联 的 值 是 600, 
与 SUSv4 相关 的 值 是 700。 

(3) SC JOB CONTROL. SC SAVED IDS 以 及 _PC_VDISABLE 的 值 不 再 表示 可 选 功 能 。 
虽然 XPG4 和 SUS 早期 版 本 要 求 支 持 这 些 选 项 ， 但 从 SUSv3 起 ， 不 再 需要 这 些 功能 ， 但 这 些 符 
号 仍然 被 保留 ， 以 便 向 后 兼容 。 

(4) 符合 POSIX.1-2008 的 平台 还 要 求 支持 下 列 选项 : 

e POSIX ASYNCHRONOUS IO 

e POSIX BARRIERS 
POSIX CLOCK SELECTION 
POSIX MAPPED FILES 

e — POSIX MEMORY PROTECTION 

e — POSIX READER WRITER LOCKS 

e POSIX REALTIME SIGNALS 

e — POSIX SEMAPHORES 

e — POSIX SPIN LOCKS 

e — POSIX THREAD SAFE FUNCTIONS 

e — POSIX THREADS 

e — POSIX TIMEOUTS 

e POSIX TIMERS 

这 些 常量 定义 成 具有 值 200809L。 相 应 的 _sc 符号 同样 是 为 了 向 后 兼容 而 被 保留 下 来 的 。 

(5) 如果 对 指定 的 pathname 或 fd 已 不 再 支持 此 功能 ， 那 么 _ PC_CHOWN_RESTRICTED 和 
PC NO TRUNC 返回 -1， 而 errno PÆ, ERARA POSIX 的 系统 中 ， 返 回 值 将 大 于 O Gea 
该 选项 被 支持 ); 

(6) PC CHOWN RESTRICT 引用 的 文件 必须 是 一 个 文件 或 者 是 一 个 目录 。 如 果 是 一 个 目录 ， 
那么 返回 值 指明 该 选项 是 否 可 应 用 于 该 目录 中 的 各 个 文件 。 

(7) PC NO TRUNC 和 _PC_2_SYMLINKS 引用 的 文件 必须 是 一 个 目录 。 

(8) PC NO TRUNC 的 返回 值 可 用 于 目录 中 的 各 个 文件 名 。 
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54 (9) PC VDISABLE 引用 的 文件 必须 是 一 个 终端 文件 。 
(10) _PC_ASYNC_IO. _PC_PRIO_IO 和 _PC_SYNC_IO 引用 的 文件 一 定 不 能 是 一 个 目录 。 
图 2-20 列 出 了 若干 配置 选项 以 及 在 本 书 所 讨论 的 4 个 示例 系统 上 的 对 应 值 。 如 果 系 统 定 
义 了 某 个 符号 常量 但 它 的 值 为 -1 或 0, 但 是 相应 的 sysconf 或 pathconf 调用 返回 的 是 -1， 
就 表示 该 项 未 被 支持 。 可 以 看 到 ， 有 些 系 统 实 现 还 没有 跟 上 Single UNIX Specification 的 最 新 
版 本 。 


POSIX CHOWN, RESTRICTED 

POSIX JOB CONTROL 

. POSIX, NO, TRUNC 

.POSIX SAVED IDS 

POSIX THREADS 200809 200112 
POSIX VDISABLE 0 0 
POSIX VERSION 200809 200112 200112 200112 
 XOPEN, UNIX 1 1 1 1 
_XOPEN_VERSION 700 600 600 600 


图 2-20 配置 选项 的 实例 
注意 ， 当 用 于 Solaris PCFS 文件 系统 中 的 文件 时 , 对 于 _PC_NO_TRUNC,， pathconf 返回 -1。 
PCFS 文件 系统 支持 DOS 格式 (软盘 格式 )，DOS 文件 名 按 DOS 文件 系统 所 要 求 8.3 格式 截断 ， 
在 进行 此 种 操作 时 并 无 任何 提示 。 


2.7 ”功能 测试 宏 


如 前 所 述 ， 头 文件 定义 了 很 多 POSIX.1 和 XSI 符号 。 但 是 除了 POSIX.1 和 XSI 定义 外 ,大 
多 数 实现 在 这 些 头 文件 中 也 加 入 了 它们 自己 的 定义 。 如 果 在 编译 一 个 程序 时 ,希望 它 只 与 POSIX 
的 定义 相关 ， 而 不 与 任何 实现 定义 的 常量 冲突 ， 那 么 就 需要 定义 常量 _POSIX_C_SOURCE。 
一 旦 定义 了 _POSIX_C_SOURCE, 所 有 POSIX.1 头 文件 都 使 用 此 常量 来 排除 任何 实现 专 有 的 
定义 。 





POSIX.1 标准 的 早期 版 本 定义 了 _POSIX_SOURCE 常量 。 在 POSIX.1 的 2001 版 中 ， 它 被 替换 
| Xi. POSIX C. SOURCE, 


"ÉE POSIX C SOURCE Á XOPEN SOURCE 被 称 为 功能 测试 宏 (feature test macro)。 所 有 
功能 测试 宏 都 以 下 划 线 开始 。 当 要 使 用 它们 时 ， 通 常 在 cc 命令 行 中 以 下 列 方式 定义 : 

cc -D POSIX C SOURCE-200809L file.c 
这 使 得 C 程序 在 包括 任何 头 文件 之 前 ， 定 义 了 功能 测试 宏 。 如 果 我 们 仅 想 使 用 POSIX.1 EX, W 
么 也 可 将 源 文 件 的 第 一 行 设置 为 : 

#define POSIX C SOURCE 200809L 

为 使 SUSv4 的 XSI 选项 可 由 应 用 程序 使 用 ， 需 将 常量 XOPEN SOURCE 定义 为 700。 除 了 让 
XSI 选项 可 用 以 外 ， 就 POSIX.1 的 功能 而 言 ， 这 与 将 _POSIX_C_SOURCE 定义 为 200809L 的 作用 
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相同 。 
SUS 将 c99 实用 程序 定义 为 C 编译 环境 的 接口 。 随 之 ， 就 可 以 用 如 下 方式 编译 文件 : 
c99 -D XOPEN SOURCE-700 file.c -o file 
可 以 使 用 -std=c99 选项 在 gcc 的 C 编译 器 中 启用 1999 ISOC 扩展， 如 下 所 示 : 


gcc -D XOPEN SOURCE-700 -std-c99 file.c -o file 


2.8 ”基本 系统 数据 类 型 


历史 上 ， 某 些 UNIX 系统 变量 已 与 某 些 C 数据 类 型 联系 在 一 起 ， 例 如 ， 历 史上 主 、 次 设备 号 
存放 在 一 个 16 位 的 短 整 型 中 ，8 位 表示 主 设备 号 ， 另 外 8 位 表示 次 设备 号 。 但 是 ， 很 多 较 大 的 系 
统 需要 用 多 于 256 个 值 来 表示 其 设备 号 ， 于 是 ， 就 需要 一 种 不 同 的 技术 。( 实 际 上 ，Solaris 用 32 
位 表示 设备 号 : 14 位 用 于 主 设备 号 ，18 位 用 于 次 设备 号 。) 

头 文 件 <sys/types .h> 中 定义 了 某 些 与 实现 有 关 的 数据 类 型 ， 它 们 被 称 为 基本 系统 数据 类 
型 《primitive system data type)。 还 有 很 多 这 种 数据 类 型 定义 在 其 他 头 文件 中 。 在 头 文件 中 ， 这 些 
数据 类 型 都 是 用 C 的 typedef 来 定义 的 。 它 们 绝 大 多 数 都 以 上 结尾 。 图 2-21 列 出 了 本 书 将 使 
用 的 一 些 基本 系统 数据 类 型 。 

用 这 种 方式 定义 了 这 些 数据 类 型 后 ， 就 不 再 需要 考虑 因 系统 不 同 而 变化 的 程序 实现 细节 。 在 
本 书 中 涉及 这 些 数据 类 型 时 ， 我 们 会 说 明 为 什么 要 使 用 它们 。 


clock t 
comp t 
dev t 
fd set 
fpos t 
gid t 
ino t 
mode t 
nlink t 
off t 


pid t 
pthread t 
ptrdiftf t 
rlim t 


sig atomic t 
sigset t 
size t 
Ssize t 
time t 

uid t 
wchar t 





时 钟 滴答 计数 器 (进程 时 间 ) C1.10 5$) 
压缩 的 时 钟 滴答 (POSIX.1 未 定义 ， 8.14 节 ) 
RES (EMM) (4.24 节 ) 

文件 描述 符 集 14.4.1 节 》) 

文件 位 置 (5.10 节 ) 

数值 组 ID 

i 节点 编号 (4.14 节 ) 

文件 类 型 ， 文 件 创建 模式 (4.5 节 ) 

目录 项 的 链接 计数 (4.14 节 ) 

文件 长 度 和 偏 移 量 〈 带 符号 的 ) (1seek，3.6 5) 
进程 ID 和 进程 组 ID 〈 带 符号 的 ) (8.2 和 9.4 节 ) 
线程 ID (11.3 节 ) 

两 个 指针 相 减 的 结果 〔 带 符号 的 ) 

资源 限制 (7.11 节 ) 

能 原子 性 地 访问 的 数据 类 型 《10.15 节 ) 
信号 集 (10.11 节 ) 

对 象 〈 如 字符 串 ) 长 度 《〈 不 带 符号 的 ) (3.7 节 》 
返回 字 节 计数 的 函数 〈 带 符号 的 ) (read、write，3.7 节 ) 
日 历时 间 的 秒 计数 器 (1.10 节 ) 

数值 用 户 ID 

能 表示 所 有 不 同 的 字符 码 


图 2-21 一 些 常用 的 基本 系统 数据 类 型 
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2.9 ”标准 之 间 的 冲突 


就 整体 而 言 ， 这 些 不 同 的 标准 之 则 配合 得 相当 好 。 因 为 SUS 基本 说 明和 POSIX.1 是 同一 个 
东西 ， 所 以 我 们 不 对 它们 进行 特别 的 说 明 ， 我 们 主要 关注 ISO C 标准 和 POSIX.1 之 间 的 差别 。 它 
们 之 闻 的 冲突 并 非 有 意 ， 但 如 果 出 现 冲突 ，POSIX.1 服从 ISO C 标准 。 然 而 它们 之 间 还 是 存在 着 
一 些 差别 的 。 

ISO C 定义 了 clock 函数 , 它 返 回 进程 使 用 的 CPU 时 间 , 返回 值 是 clock t 类 型 值 , 但 ISO 
C 标准 没有 规定 它 的 单位 。 为 了 将 此 值 变 换 成 以 秒 为 单位 ， 需 要 将 其 除 以 在 <time .h> 头 文件 中 
定义 的 CLOCKS_PER_SEC。POSIX.1 定义 了 times 函数 ， 它 返回 其 调用 者 及 其 所 有 终止 子 进程 
的 CPU 时 间 以 及 时 钟 时 间 ， 所 有 这 些 值 都 是 clock t 类 型 值 。sysconf 函数 用 来 获得 每 秒 滴 
答 数 ， 用 于 表示 times 函数 的 返回 值 。ISO C 和 POSIX.1 用 同一 种 数据 类 型 《clock t) KR 
存 对 时 间 的 测量 ， 但 定义 了 不 同 的 单位 。 这 种 差别 可 以 在 Solaris 中 看 到 ， 其 中 clock 返回 微 秒 
数 (CLOCK_PER_SEC 是 100 万 ) ， 而 sysconf 为 每 秒 滴答 数 返 回 的 值 是 100。 因 此 ， 我 们 在 使 
用 clock t 类 型 变量 的 时 候 ， 必 须 十 分 小 心 以 免 混 淆 不 同 的 时 间 单 位 。 

另 一 个 可 能 产生 冲突 的 地 方 是 : 在 ISO C 标准 说 明 函 数 时 ， 可 能 没有 像 POSIX.1 那样 严 。 在 
POSIX 环境 下 ， 有 些 函 数 可 能 要 求 有 一 个 与 C 环境 下 不 同 的 实现 ， 因 为 POSIX 环境 中 有 多 个 进 
程 ， 而 ISO C 环境 则 很 少 考虑 宿主 操作 系统 。 尽 管 如 此 ， 很 多 符合 POSIX 的 系统 为 了 兼容 性 
也 会 实现 ISO CMR. signal 函数 就 是 一 个 例子 。 如 果 在 不 了 解 的 情况 下 使 用 了 Solaris 提 
供 的 signal ARM (希望 编写 可 在 ISO C 环境 和 较 早 UNIX 系统 中 运行 的 可 兼容 程序 ) ， 那 
么 它 提供 了 与 POSIX.1 sigaction HAAR NX. B10 章 将 对 signal MAME SR. 
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在 过 去 25 年 多 的 时 间 里 ，UNIX 编程 环境 的 标准 化 已 经 取得 了 很 大 进展 。 本 章 对 3 个 主要 标 
准 一 一 I[SO C. POSIX 和 Single UNIX Specification 进行 了 说 明 ， 也 分 析 了 这 些 标准 对 本 书 主要 关 
注 的 4 个 实现 ， 即 FreeBSD. Linux. Mac OS X 和 Solaris 所 产生 的 影响 。 这 些 标 准 都 试图 定义 一 
些 可 能 随 实 现 而 更 改 的 参数 ， 但 是 我 们 已 经 看 到 这 些 限制 并 不 完美 。 本 书 将 涉及 很 多 这 些 限制 和 
幻 常 量 。 

在 本 书 最 后 的 参考 书目 中 ， 说 明了 如 何 获得 这 些 标准 的 方法 。 


习题 


2.1 在 2.8 节 中 提 到 一 些 基 本 系统 数据 类 型 可 以 在 多 个 头 文件 中 定义 。 例 如 , 在 FreeBSD 8.0 中 ， 
size_t 在 29 个 不 同 的 头 文件 中 都 有 有 定义。 由 于 一 个 程序 可 能 包含 这 29 个 不 同 的 头 文件 ， 
但 是 ISO C 却 不 允许 对 同一 个 名 字 进 行 多 次 typedef， 那 么 如 何 编写 这 些 头 文件 呢 ? 

22 ”检查 系统 的 头 文件 ， 列 出 实现 基本 系统 数据 类 型 所 用 到 的 实际 数据 类 型 。 

2.3 ”改写 图 2-17 中 的 程序 ， 使 其 在 sysconf 为 OPEN_MAX 限制 返回 LONG_MAX 时 ， 避 免 进行 
不 必要 的 处 理 。 





文件 I/O 





3.1 引言 


本 章 开始 讨论 UNIX 系统 ， 先 说 明 可 用 的 文件 IO 函数 一 一 打开 文件 、 读 文件 、 写 文件 等 。 
UNIX 系统 中 的 大 多 数 文 件 VO 只 需 用 到 5 PRM: open. read. write. lseek 以 及 close. 
然后 说 明 不 同 缓冲 长 度 对 read 和 write 函数 的 影响 。 

本 章 描述 的 函数 经 常 被 称 为 不 带 缓冲 的 IO Cunbuffered IO， 与 将 在 第 5 章 中 说 明 的 标准 VO 
函数 相对 照 )。 术 语 不 带 缓冲 指 的 是 每 个 read 和 write 都 调用 内 核 中 的 一 个 系统 调用 。 这 些 不 
带 缓冲 的 IO 函数 不 是 ISOC 的 组 成 部 分 , 但是， 它们 是 POSIX.1 和 Single UNIX Specification 的 
组 成 部 分 。 

只 要 涉 太 在 多 个 进程 间 共 享 资源 ， 原 子 操作 的 概念 就 变 得 非常 重要 。 我 们 将 通过 文件 TO 和 open 
函数 的 参数 来 讨论 此 概念 。 然 后 ， 本 章 将 进一步 讨论 在 多 个 进程 间 如 何 共 享 文件 ， 以 及 所 涉及 的 内 核 
有 关 数 据 结 构 。 在 描述 了 这 些 特征 后 ， 将 说 明 dup、fcntl1、sync、fsync 和 ioctl MR. 


3.2 文件 描述 符 


对 于 内 核 而 言 ， 所 有 打开 的 文件 都 通过 文件 描述 符 引 用 。 文 件 描述 符 是 一 个 非 负 整数 。 当 打 
开 一 个 现 有 文件 或 创建 一 个 新 文件 时 ， 内 核 向 进程 返回 一 个 文件 描述 符 。 当 读 、 写 一 个 文件 时 ， 
使 用 open 或 creat 返回 的 文件 描述 符 标 识 该 文件 ， 将 其 作为 参数 传送 给 read 或 write. 
按照 惯例 ，UNIX 系统 shell 把 文件 描述 符 0 与 进程 的 标准 输入 关联 ,文件 描述 符 1 与 标准 输 
出 关联 , 文件 描述 符 2 与 标准 错误 关联 。 这 是 各 种 shell 以 及 很 多 应 用 程序 使 用 的 惯例 ,与 UNIX 
内 核 无 关 。 尽 管 如 此 ， 如 果 不 遵循 这 种 惯例 ， 很 多 UNIX 系统 应 用 程序 就 不 能 正常 工作 。 
在 符合 POSIX.1 的 应 用 程序 中 ， 幻 数 0、1、2 虽然 已 被 标准 化 ， 但 应 当 把 它们 替换 成 符号 常 
量 STDIN FILENO. STDOUT FILENO 和 STDERR FILENO 以 提高 可 读 性 。 这 些 常量 都 在 头 文 
件 <unistd.h> 中 定义 。 
文件 描述 符 的 变化 范围 是 0~oPEN_MAX-1( 见 图 2-11)。 早 期 的 UNIX 系统 实现 采用 的 上 限 
值 是 19〔 人 允许 每 个 进程 最 多 打开 20 个 文件 )， 但 现在 很 多 系统 将 其 上 限 值 增 加 至 63. 
| 对 于 FreeBSD 8.0, Linux 3.2.0, Mac OS X 10.6.8 以 及 Solaris 10, 文件 描述 符 的 变化 范围 几乎 
， 是 无 限 的 ， 它 只 受到 系统 配置 的 存储 器 总 量 、 整 型 的 字 长 以 及 系统 管理 员 所 配置 的 坎 限制 和 硬 限 
: 制 的 约束 。 
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3.3 X open 和 openat 


调用 open 或 openat 函数 可 以 打开 或 创建 一 个 文件 。 


#include «fcntl.h» 


int open(const char *path, int oflag,... /* mode t mode */); 


int openat(int fd, const char *path, int oflag, ... /* mode t mode */ ); 
两 函数 的 返回 值 ， 著 成功， 返回 文件 描述 符 ， 车 出 错 ， 返 回 --] 


我 们 将 最 后 一 个 参数 写 为 . . .，ISO C 用 这 种 方法 表明 余下 的 参数 的 数量 及 其 类 型 是 可 变 的 。 
对 于 open 函数 而 言 ， 仅 当 创建 新 文件 时 才 使 用 最 后 这 个 参数 〈 稍 后 将 对 此 进行 说 明 )。 在 函数 原 
型 中 将 此 参数 放置 在 注释 中 。 

path 参数 是 要 打开 或 创建 文件 的 名 字 。oflag 参数 可 用 来 说 明 此 函数 的 多 个 选项 。 用 下 列 一 个 
或 多 个 常量 进行 “或 ”运算 构成 oflag 参数 (这些 常 量 在 头 文件 <fcnt1 .h> 中 定义 )。 

O_RDONLY 只 读 打开 。 





O_WRONLY 只 写 打开 。 

O_RDWR We. CERTI. 
| 大 多 数 实现 将 O RDONLY 4.3.23 0, O WRONLY ZXH 1, O RDWR 定义 为 2， 以 与 早期 
i 的 程序 兼容 。 

O EXEC 只 执行 打开 。 

O SEARCH 只 搜索 打开 〈 应 用 于 目录 )。 


O SEARCH 常量 的 目的 在 于 在 目录 打开 时 验证 它 的 搜索 权限 。 对 目录 的 文件 描述 符 的 后 续 操 
作 就 不 需要 再 次 检查 对 该 目录 的 搜索 权限 。 本 书 中 涉及 的 操作 系统 目前 都 没有 支持 O_SERRCH。 


在 这 5 个 常量 中 必须 指定 一 个 且 只 能 指定 一 个 。 下 列 常 量 则 是 可 选 的 。 


O APPEND 每 次 写 时 都 追加 到 文件 的 尾 端 。3.11 节 将 详细 说 明 此 选项 。 
O CLOEXEC 把 FD CLOEXEC 常量 设置 为 文件 描述 符 标志 。3.14 节 中 将 说 明文 件 描述 
O CREAT 车 此 文件 不 存在 则 创建 它 。 使 用 此 选项 时 ，open 函数 需 同 时 说 明 第 3 个 


参数 mode (openat 函数 需 说 明 第 4 个 参数 mode), 用 mode 指定 该 新 文 
件 的 访问 权限 位 〈4.5 节 将 说 明文 件 的 权限 位 ， 那 时 就 能 了 解 如 何 指定 
mode， 以 及 如 何 用 进程 的 umask 值 修改 它 )。 

O DIRECTORY WẸ path 引用 的 不 是 目录 ， 则 出 错 。 

O EXCL 如 果 同 时 指定 了 0_CREAT， 而 文件 已 经 存在 ， 则 出 错 。 用 此 可 以 测试 一 
个 文件 是 否 存 在 ， 如 果 不 存 在 ， 则 创建 此 文件 ， 这 使 测试 和 创建 两 者 成 
为 一 个 原子 操作 。3.11 节 将 更 详细 地 说 明 原 子 操作 。 

O NOCTTY 如 果 path 引用 的 是 终端 设备 , 则 不 将 该 设备 分 配 作为 此 进程 的 控制 终端 。 
9.6 节 将 说 明 控 制 终端 。 

O NOFOLLOW 如 果 path 引用 的 是 一 个 符号 链接 ， 则 出 错 。4.17 节 将 说 明 符 号 链接 。 

O NONBLOCK 如 果 path 引用 的 是 一 个 FIFO、 一 个 块 特殊 文件 或 一 个 字符 特殊 文件 ， 则 
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此 选项 为 文件 的 本 次 打开 操作 和 后 续 的 VO 操作 设置 非 阻塞 方式 .14.2 节 
将 说 明 此 工作 模式 。 


! 较 早 的 System V 引入 了 O_NDELAY (不 延迟 ) 标志 ， 它 与 0 NONBLOCK (不 阻塞 ) 选 
| 项 类 似 , 但 它 的 读 操作 返回 值 具有 二 义 性 。 如 果 不 能 从 管道 、FIFO 或 设备 读 得 教 据 ， 则 不 延 
| AGATUR read 返回 0， 这 与 表示 已 读 到 文件 尾 端的 返回 值 0 冲突 。 基 于 SVR4 的 系统 仍 支 
| 特 这 种 语义 的 不 延迟 选项 ， 但 是 新 的 应 用 程序 应 当 使 用 不 阻塞 选项 代替 之 。 


O SYNC 使 每 次 write 等 待 物理 IO 操作 完成 , 包括 由 该 write 操作 引起 的 文件 
属性 更 新 所 需 的 WO。3.14 节 将 使 用 此 选项 。 
O TRUNC 如 果 此 文件 存在 ， 而 且 为 只 写 或 读 -写成 功 打 开 ， 则 将 其 长 度 截 断 为 0。 


O TTY INIT 如 果 打 开 一 个 还 未 打开 的 终端 设备 ， 设 置 非 标 准 termios 参数 值 ， 使 其 
符合 Single UNIX Specification。 第 18 章 将 讨论 终端 IO 的 termios 结构 。 
下 面 两 个 标志 也 是 可 选 的 。 它 们 是 Single UNIX Specification (LAR POSIX.1) 中 同步 输入 和 
输出 选项 的 一 部 分 。 
O DSYNC 使 每 次 write 要 等 待 物理 IO 操作 完成 ， 但 是 如 果 该 写 操 作 并 不 影响 读 
取 刚 写 入 的 数据 ， 则 不 需 等 待 文件 属性 被 更 新 。 


O DSYNC 和 O SYNC 标志 有 微妙 的 区 别 。 仅 当 文 件 属性 需要 更 新 以 反映 文件 数据 变化 
: (例如 , 更 新 文件 大 小 以 反映 文件 中 包含 了 更 多 的 数据 ) 时 ，O_DSYNC 标志 才 影 响 文件 属性 。 
WX Oo SYNC 标志 后 ， 数 据 和 属性 总 是 同步 更 新 。 当 文件 用 O_DSYN 标志 打开 ， 在 重 写 其 
| 现 有 的 部 分 内 容 时 ， 文 件 时 间 属 性 不 会 同步 更 新 。 与 此 相反 ， 如 果 文 件 是 用 O_SYNC MSA 
， 开 ， 那 么 对 该 文件 的 每 一 次 write MEA write 返回 前 更 新 文件 时 间 ， 这 与 是 否 改写 现 有 
| 字 节 或 追加 写 文件 无 关 。 


O RSYNC 使 每 一 个 以 文件 描述 符 作为 参数 进行 的 read 操作 等 待 , 直至 所 有 对 文件 
同一 部 分 挂 起 的 写 操作 都 完成 。 


Solaris 10 支持 所 有 这 3 个 标志 。FreeBSD ( 和 Mac OS X) 设置 了 另外 一 个 标志 
| (O_FSYNC )， 它 与 标志 0_SYNC 的 作用 相同 。 因 为 这 两 个 标志 是 等 效 的 ， 它 们 定义 的 标志 具 
| 有 相同 的 值 ,FreeBSD 8.0 不 支持 O_DSYNC 3, O RSYNC 标志 。Mac OS X 并 不 支持 O RSYNC, 
”但 却 定义 了 O_DSYNC, 2b O_DSYNC 与 处 理 O SYNC 相同 。Linux 3.2.0 定义 了 O DSYNC, 
”但 处 理 O_RSYNC 与 处 理 O. SYNC 相同 。 


由 open 和 openat 函数 返回 的 文件 描述 符 一 定 是 最 小 的 未 用 描述 符 数 值 。 这 一 点 被 某 些 应 
用 程序 用 来 在 标准 输入 、 标 准 输出 或 标准 错误 上 打开 新 的 文件 。 例 如 ， 一 个 应 用 程序 可 以 先 关 闭 
标准 输出 〈 通 常 是 文件 描述 符 1)， 然 后 打开 另 一 个 文件 ， 热 行 打开 操作 前 就 能 了 解 到 该 文件 一 定 
会 在 文件 描述 符 1 上 打开 。 在 3.12 节 说 明 dup2 函数 时 ， 可 以 了 解 到 有 更 好 的 方法 来 保证 在 一 个 
给 定 的 描述 符 上 打开 一 个 文件 。 

有 所 参数 把 open fll openat 函数 区 分 开 ， 共 有 3 种 可 能 性 。 

(1) path 参数 指定 的 是 绝对 路 径 名 ， 在 这 种 情况 下 ， 应 参数 被 忽略 ，openat 函数 就 相当 于 
open AR. 

(2) path 参数 指定 的 是 相对 路 径 名 ， 应 参数 指出 了 相对 路 径 名 在 文件 系统 中 的 开始 地 址 。. 反 
参数 是 通过 打开 相对 路 径 名 所 在 的 目录 来 获取 。 
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(3) path 参数 指定 了 相对 路 径 名 ， 应 参数 具有 特殊 值 AT_FDCWD。 在 这 种 情况 下 ， 路 径 名 在 
当前 工作 目录 中 获取 ，openat 函数 在 操作 上 与 open 函数 类 似 。 

openat 函数 是 POSIX.1 最 新 版 本 中 新 增 的 一 类 函数 之 一 ， 和 希望 解决 两 个 问题 。 第 一 ， 让 线 
程 可 以 使 用 相对 路 径 名 打开 目录 中 的 文件 ， 而 不 再 只 能 打开 当前 工作 目录 。 在 第 11 章 我 们 会 看 
到 ， 同 一 进程 中 的 所 有 线程 共享 相同 的 当前 工作 目录 ， 因 此 很 难 让 同一 进程 的 多 个 不 同 线程 在 同 
一 时 间 工 作 在 不 同 的 目录 中 。 第 二 ， 可 以 避免 time-of-check-to-time-of-use (TOCTTOU) 错误 。 

TOCTTOU 错误 的 基本 思想 是 ， 如果 有 两 个 基于 文件 的 函数 调用 ， 其 中 第 二 个 调用 依赖 于 第 
一 个 调用 的 结果 ， 那 么 程序 是 脆弱 的 。 因 为 两 个 调用 并 不 是 原子 操作 ， 在 两 个 函数 调用 之 间 文 件 
可 能 改变 了 ， 这 样 也 就 造成 了 第 一 个 调用 的 结果 就 不 再 有 效 ， 使 得 程序 最 终 的 结果 是 错误 的 。 文 
件 系统 命名 空间 中 的 TOCTTOU 错误 通常 处 理 的 就 是 那些 颠 绪 文件 系统 权限 的 小 把 戏 , 这 些小 把 
戏 通 过 骗取 特权 程序 降低 特权 文件 的 权限 控制 或 者 让 特权 文件 打开 一 个 安全 漏洞 等 方式 进行 。 
Wei 和 Pu[2005]Z€ UNIX 文件 系统 接口 中 讨论 了 TOCTTOU 的 缺陷 。 

文件 名 和 路 径 名 截断 

如 果 NAME_MAX 是 14， 而 我 们 却 试图 在 当前 目录 中 创建 一 个 文件 名 包含 15 个 字符 的 新 文件 ， 此 时 
会 发 生 什 么 呢 ? 按照 传统 ， 早 期 的 System V 版 本 《如 SVR2) 允许 这 种 使 用 方法 ， 但 总 是 将 文件 名 截断 
为 14 个 字符 ， 而 且 不 给 出 任何 信息 ， 而 BSD 类 的 系统 则 返回 出 错 状态 ， 并 将 errno 设置 为 
ENAMETOOLONG. 无 声 无 息 地 截断 文件 名 会 引起 问题 , 而 且 它 不 仅仅 影响 到 创建 新 文件 。 如 果 NAME MAX 
是 14, 而 存在 一 个 文件 名 恰好 就 是 14 个 字符 的 文件 , 那么 以 路 径 名 作为 其 参数 的 任 一 函数 Copen, stat 
等 ) 都 无 法 确定 该 文件 的 原始 名 是 什么 。 其 原因 是 这 些 函 数 无 法 判断 该 文件 名 是 否 被 截断 过 。 

在 POSIX.1 中 , 常量 POSIX NO TRUNC 决定 是 要 截断 过 长 的 文件 名 或 路 径 名 ， 还 是 返回 一 个 
出 错 。 正 如 我 们 在 第 2 章 中 已 经 见 过 的 ， 根 据 文 件 系统 的 类 型 ， 此 值 可 以 变化 。 我 们 可 以 用 


fpathconf 或 pathconf 来 查询 目录 具体 支持 何 种 行为 ,到底 是 截断 过 长 的 文件 名 还 是 返回 出 错 。 
| 是 否 返回 一 个 出 错 值 在 很 大 程度 上 是 历史 形成 的 。 例 如 。 基 于 SVR4 的 系统 对 传统 的 System V 
“文件 系统 (SS) 并 不 出 错 ， 但 是 它 对 BSD 风格 的 文件 系统 (UFS ) 则 出 错 。 作 为 另 一 个 例子 ( 参 
见 图 2-20), Solaris 对 UFS 返回 出 错 ， 对 与 DOS 兼容 的 文件 系统 PCFS 则 不 返回 出 错 ， 其 原因 是 
DOS 会 无 声 无 息 地 截断 不 匹配 8.3 格式 的 文件 名 。BSD 类 系统 和 Linux 总 是 会 返回 出 错 。 


X PosIX_NO_TRUNC 有 效 ， 则 在 整个 路 径 名 超过 PATH_MAX， 或 路 径 名 中 的 任 一 文件 名 超 
过 NAME MAX 时 ， 出 错 返 回 ， 并 将 errno 设置 为 ENAMETOOLONG. 


。 大 多 数 的 现代 文件 系统 支持 文件 名 的 最 大 长 度 可 以 为 255。 因 为 文件 名 通常 比 这 个 限制 要 短 ， 
E3 ; 因此 对 大 多 数 应 用 程序 来 说 这 个 限制 还 未 出 现 什么 问题 。 


3.4 AX creat 


也 可 调用 creat 函数 创建 一 个 新 文件 。 


#include «fcntl.h» 


int creat(const char *path, mode t mode); 


KAA: 若 成 功 ， 返 回 为 只 写 打开 的 文件 描述 符 : Hu e- 





注意 ， 此 函数 等 效 于 : 
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open (path, O WRONLY | © CREAT|O TRUNC, mode); 


在 早期 的 UNIX 系统 版 本 中 ，open 的 第 二 个 参数 只 能 是 0、1 或 2。 无 法 打开 一 个 尚未 存在 
: 的 文件 ， 因 此 需要 另 一 个 系统 调用 creat 以 创建 新 文件 。 ME, open 函数 提供 了 选项 0 CREAT 
i 和 0O_TRUNC， 于 是 也 就 不 再 需要 单独 的 creat HK, 
在 4.5 节 中 ， 我 们 将 详细 说 明文 件 访 问 权 限 ， 并 说 明 如 何 指定 mode. 
creat 的 一 个 不 足 之 处 是 它 以 只 写 方式 打开 所 创建 的 文件 。 在 提供 open 的 新 版 本 之 前 ， 如 
果 要 创建 一 个 临时 文件 ， 并 要 先 写 该 文件 ， 然 后 又 读 该 文件 ， 则 必须 先 调用 creat. close, fA 
后 再 调用 open。 现 在 则 可 用 下 列 方式 调用 open 实现 : 


open (path, O_RDWR |O CREAT|O TRUNC, mode); 


3.5 PAR close 


可 调用 close 函数 关闭 一 个 打开 文件 。 


#include <unistd.h> 


int close (int fd); 





关闭 一 个 文件 时 还 会 释放 该 进程 加 在 该 文件 上 的 所 有 记录 锁 。14.3 节 将 讨论 这 一 点 。 
当 一 个 进程 终止 时 ， 内 核 自动 关闭 它 所 有 的 打开 文件 。 很 多 程序 都 利用 了 这 一 功能 而 不 显 式 
地 用 close 关闭 打开 文件 。 实 例 见 图 1-4 程序 。 


3.6 PAR lseek 


每 个 打开 文件 都 有 一 个 与 其 相关 联 的 “当前 文件 偏 移 量 ”(current file offset)。 它 通常 是 一 个 
非 负 整数 ， 用 以 度量 从 文件 开始 处 计算 的 字 节 数 〈 本 节 稍 后 将 对 “ 非 负 ” 这 一 修饰 词 的 某 些 例外 
进行 说 明 )。 通 常 ， 读 、 写 操作 都 从 当前 文件 偏 移 量 处 开始 ， 并 使 偏 移 量 增加 所 读 写 的 字 节 数 。 

按 系统 默认 的 情况 ， 当 打开 一 个 文件 时 ， 除 非 指定 O APPEND 选项 ， 否 则 该 偏 移 量 被 设置 为 0。 

可 以 调用 1seek 显 式 地 为 一 个 打开 文件 设置 偏 移 量 。 


#include <unistd.h> 


off t lseek(int fd, off t offset, int whence); 
BEA: 若 成 功 ， 返 回 新 的 文件 偏 移 量 ; 若 出 错 ， 返 回 为 -1 





对 参数 offset 的 解释 与 参数 whence 的 值 有 关 。 

e X whence 是 SEEK SET， 则 将 该 文件 的 偏 移 量 设置 为 上 距 文件 开始 处 offset 个 字 节 。 

。 di whence 是 SEEK CUR， 则 将 该 文件 的 偏 移 量 设置 为 其 当前 值 加 offset, ofset 可 为 正 或 负 。 
e Zi whence 是 SEEK_END， 则 将 该 文件 的 偏 移 量 设置 为 文件 长 度 加 offset, offset 可 正 


可 负 。 
若 lseek 成 功 执行 ， 则 返回 新 的 文件 偏 移 量 ， 为 此 可 以 用 下 列 方式 确定 打开 文件 的 当前 偏 移 量 : 
off t currpos; 


currpos - lseek(fd, 0, SEEK CUR); 
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这 种 方法 也 可 用 来 确定 所 涉及 的 文件 是 否 可 以 设置 偏 移 量 。 如 果 文 件 描述 符 指向 的 是 一 个 管 
道 、FIFO 或 网 络 套 接 字 ， 则 lseek 返回 一 1， 并 将 errno 设置 为 ESPIPE。 


| 3 个 符号 常量 SEEK SET, SEEK CUR fe SEEK END 是 在 System V 中 引入 的 。 在 System V 之 


| 前 ，whence 被 指定 为 0( 绝对 偏 移 量 )、1 ( 相对 于 当前 位 置 的 偏 移 蝇 ) 或 2 ( 相对 文件 尾 端的 信 
| 移 量 )。 很 多 软件 仍然 把 这 些 数字 直接 写 在 代码 里 。 

| 在 lseek 中 的 字符 1 表示 长 整 型 。 在 引入 off 七 数据 类 型 之 前 ，ofser 参数 和 返回 值 是 长 束 
型 的 ,lseek 是 在 UNIXV7 中 引入 的 ,当时 C 语言 中 增加 了 长 整 型 ( UNIX V6 中 ,用 函数 seek 
| fe tell 提供 类 似 功能 )。 


Pa 实例 
3-1 所 示 的 程序 用 于 测试 对 其 标准 输入 能 否 设置 偏 移 量 。 
finclude "apue.h" 
int 
main(void) 
{ 
if (lseek(STDIN FILENO, 0, SEEK CUR) == -1) 
printf("cannot seek\n"); 
else 
printf ("seek OK\n"); 
exit (0); 


图 3-1 测试 标准 输入 能 人 否 被 设置 偏 移 量 
如 果 用 交互 方式 调用 此 程序 ， 则 可 得 


$ ./a.out < /etc/passwd 

seek OK 

$ cat « /etc/passwd| ./a.out 
cannot seek 

$ ./a.out « /var/spool/cron/FIFO 
cannot seek 


通常 ， 文 件 的 当前 偏 移 量 应 当 是 一 个 非 负 整 数 ， 但 是 ， 某 些 设 备 也 可 能 允许 负 的 偏 移 量 。 但 
对 于 普通 文件 ， 其 偏 移 量 必 须 是 非 负 值 。 因 为 偏 移 量 可 能 是 负 值 ， 所 以 在 比较 1seek 的 返回 值 
时 应 当 谨 慎 ， 不 要 测试 它 是 否 小 于 0， 而 要 测试 它 是 否 等 于 一 1。 
| — 在 Intelx86 处 理 器 上 运行 的 FreeBSD 的 设备 /dev/kmem 支持 负 的 偏 移 量 。 
| 因为 偏 移 量 (ott t) 是 带 符号 数据 类 型 ( 见 图 2-21 )， 所 以 文件 的 最 大 长 度 会 减少 一 半 。 例 
,如 ,车 off 上 了 上 是 32 位 整 型 ， 则 文件 最 大 长 度 是 2 -1 个 字 节 。 


lseek 仅 将 当前 的 文件 偏 移 量 记录 在 内 核 中 ， 它 并 不 引起 任何 IO 操作 。 然 后 ， 该 偏 移 量 用 
于 下 一 个 读 或 写 操作 。 

文件 偏 移 量 可 以 大 于 文件 的 当前 长 度 ， 在 这 种 情况 下 ， 对 该 文件 的 下 一 次 写 将 加 长 该 文件 ， 
并 在 文件 中 构成 一 个 空洞 ， 这 一 点 是 允许 的 。 位 于 文件 中 但 没有 写 过 的 字 节 都 被 读 为 0。 

文件 中 的 空洞 并 不 要 求 在 磁盘 上 占用 存储 区 。 具 体 处 理 方式 与 文件 系统 的 实现 有 关 ， 当 定位 
到 超出 文件 尾 端 之 后 写 时 ， 对 于 新 写 的 数据 需要 分 配 磁盘 块 ， 但 是 对 于 原文 件 尾 端 和 新 开始 写 位 


置 之 间 的 部 分 则 不 需要 分 配 磁盘 块 。 
^w 实例 
图 3-2 所 示 的 程序 用 于 创建 一 个 具有 空洞 的 文件 。 


#include "apue.h" 
#include «fcntl.h» 


char buf1[] 
char buf2[] 


"abcdefghij"; 
"ABCDEFGHIJ"; 


int 
main (void) 
{ 
int fd; 


if ((fd = creat("file.hole", FILE MODE)) < 0) 
err Sys("creat error"); 


if (write(fd, bufl, 10) !- 10) 
err Sys("bufl write error"); 
/* offset now - 10 */ 


if (lseek(fd, 16384, SEEK SET) == -1) 
err sys("lseek error"); 
/* offset now - 16384 */ 


if (write(fd, buf2, 10) !- 10) 
err sys("buf2 write error"); 
/* offset now - 16394 */ 


exit(0); 
} 

图 3-2 创建 一 个 具有 空洞 的 文件 
运行 该 程序 得 到 : 
$ ./a.out 
$ ls -1 file.hole 检查 其 大 小 
-rw-r--r-- 1 sar 16394 Nov 25 01:01 file.hole 
$ od -c file.hole 观察 实际 内 容 


0000000 a b c d e f g h i j NO NO NO NO NO XO 
0000020 XO XO NO XO NO NO NO NO NO NO NO NO NO NO NO \O 
* 


0040000 A B C D E F GH I J 
0040012 


3.6 


函数 lseek 
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使 用 od(1) 命 令 观察 该 文件 的 实际 内 容 。 命 令 行 中 的 -c 标志 表示 以 字符 方式 打印 文件 内 容 。 从 中 


可 以 看 到 , 文件 中 间 的 30 个 未 写 入 字 节 都 被 读 成 0。 每 一 行 开始 的 一 个 7 位 数 是 以 八进制 形式 表 


示 的 字 节 偏 移 量 。 


为 了 证 明 在 该 文件 中 确实 有 一 个 空洞 ， 将 刚 创建 的 文件 与 同样 长 度 但 无 空洞 的 文件 进行 


比较 : 
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$ 1s -1s file.hole file.nohole 比较 长 度 
8 -rw-r--r-- 1 sar 16394 Nov 25 01:01 file.hole 
20 -rw-r--r-- 1 sar 16394 Nov 25 01:03 file.nohole 


虽然 两 个 文件 的 长 度 相 同 , 但 无 空洞 的 文件 占用 了 20 个 磁盘 块 ， 而 具有 空洞 的 文件 只 占用 8 
个 磁盘 块 。 

在 此 实例 中 调用 了 将 在 3.8 节 中 说 明 的 write 函数 。4.12 节 将 对 具有 空洞 的 文件 进行 更 多 
说 明 ` = 


因为 1seek 使 用 的 偏 移 量 是 用 ott t 类 型 表示 的 ， 所 以 允许 具体 实现 根据 各 自 特定 的 平台 
自行 选择 大 小 合适 的 数据 类 型 。 现 今 大 多 数 平台 提供 两 组 接口 以 处 理 文件 偏 移 量 。 一 组 使 用 32 
位 文件 偏 移 量 ， 另 一 组 则 使 用 64 位 文件 偏 移 量 。 
Single UNIX Specification 向 应 用 程序 提供 了 一 种 方法 ， 使 其 通过 sysconf 函数 确定 支持 何 
种 环境 ( 见 2.5.4 节 )。 图 3-3 总 结 了 定义 的 sysconf 常量 。 


POSIX V7 ILP32 OFF32 int、long、 指 针 和 off_t 类 型 是 32 位 .SC V7 ILP32 OFF32 
POSIX V7 ILP32 OFFBIG int. long. EXAME 32%, off t 类 型 | SC v7 ILP32 OFFBIG 
至 少 是 64 位 


POSIX V? LP64 OFF64 int 类 型 是 32 位 ，Long、 指 针 和 of f_t K | sc v? LP64 OFF64 
型 是 64 位 

POSIX V7 LP64 OFFBIG int 类 型 是 32 位 ，Long、 指 针 和 off 七 类 | sC v7 LP64 OFFBIG 
型 至 少 是 64 位 





图 3-3 sysconf 的 数据 大 小 选项 和 name 参数 


c99 编译 器 要 求 使 用 getconf(1) 命 令 将 所 期 望 的 数据 大 小 模型 映射 为 编译 和 链接 程序 所 需 
的 标志 。 根 据 每 个 平台 支持 环境 的 不 同 ， 可 能 需要 不 同 的 标志 和 库 。 


Doo 遗 忠 的 是 ， 在 这 方面 ， 实 现 还 未 跟 上 标准 的 步伐 。 如 果 你 的 系统 没有 匹配 标准 的 最 新 版 本 ， 那 
i 么 系统 还 可 能 支持 Single UNIX Specification 前 一 版 本 中 的 选项 名 : _POSIX_V6_ILP32_OFF32, 
| POSIX V6 ILP32 OFFBIG、 POSIX V6 LP64 OFF64 和 POSIX V6 LP64 OFFBIG。 

1 为 了 避 开 这 一 点 ， 应 用 程序 可 以 将 符号 常量 FILE OFFSET BITS 设置 为 64， 以 支持 64 位 
偏 移 量 。 这 样 就 将 off t 定义 更 改 为 64 位 带 符号 整 型 。 将 FILE OFFSET BITS 符号 常量 设置 
为 32 以 支持 32 位 偏 移 量 。 但 是 ,- 应 当 注意 的 是 ， 虽 然 本 书 讨论 的 4 种 平台 都 支持 32 位 和 64 位 
; 文件 偏 移 量 ， 但 是 通过 设置 _ FTLE_OFFSET_BITS 符号 常量 的 值 这 种 方法 并 不 能 保证 应 用 程序 是 
l 可 移植 的 ， 也 有 可 能 达 不 到 预期 的 效果 。 

(0 图 3-4 总 结 了 在 本 书 涉 及 的 4 种 平台 上 ， 当 应 用 程序 没有 定义 _FTLE_OFFSET BITS M, off t 
| 数据 类 型 的 字 节 数 以 及 _FILE OFFSET_BITS EUX 32 或 多时 ，off_t 数 据 类 型 的 字 节 数 。 


FILE OFFSET BITS | FILE OFFSET BITS ft | 
MER CPU 架构 


 FreeBSD&O — | 8.0 

Linux 3.2.0 x86 64 ü 
Mac OS X 10.6.8 x86 64 位 
Solaris 10 SPARC 64 位 


3-4 ”不同 平台 上 of f.t 的 字 节 数 
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注意 ， 尽 管 可 以 实现 64 位 文件 偏 移 量 ， 但 是 能 否 创建 一 个 大 于 2 GB (231 一 1 字 节 ) 的 文件 
则 依赖 于 底层 文件 系统 的 类 型 。 


3.7 函数 read 


调用 read 函数 从 打开 文件 中 读数 据 。 


#include <unistd.h> 


ssize t read(int fd, void *buf, size t nbytes); 


返回 值 ， 读 到 的 字 节 数 ， 着 已 到 文件 尾 ， 返 回 Fh, gE- 


如 read 成 功 ， 则 返回 读 到 的 字 节 数 。 如 已 到 达 文 件 的 尾 端 ， 则 返回 0。 

有 多 种 情况 可 使 实际 读 到 的 字 节 数 少 于 要 求 读 的 字 节 数 : 

e 读 普通 文件 时 ， 在 读 到 要 求 字 节 数 之 前 已 到 达 了 文件 尾 端 。 例 如 ， 著 在 到 达 文 件 尾 端 之 前 
有 30 个 字 节 ， 而 要 求 读 100 个 字 节 ， 则 read 返回 30。 下 一 次 再 调用 read 时 ， 它 将 返回 
0 文件 尾 端 )。 

e 当 从 终端 设备 读 时 ， 通 常 一 次 最 多 读 一 行 〈 第 18 章 将 介绍 如 何 改 变 这 一 点 )。 

e 当 从 网 络 读 时 ， 网 络 中 的 缓冲 机 制 可 能 造成 返回 值 小 于 所 要 求 读 的 字 节 数 。 

e. 当 从 管道 或 FIFO 读 时 ， 如 车 管道 包含 的 字 节 少 于 所 需 的 数量 ， 那 么 read 将 只 返回 实际 
可 用 的 字 节 数 。 

e 当 从 某 些 面向 记录 的 设备 〈 如 磁带 ) 读 时 ， 一 次 最 多 返回 一 个 记录 。 
当 一 信号 造成 中 断 ， 而 已 经 读 了 部 分 数据 量 时 。 我 们 将 在 10.5 节 进 一 步 讨 论 此 种 情况 。 

VERE A CIS 前 偏 移 量 处 开始 ， 在 成 功 返回 之 前 ， 该 偏 移 量 将 增加 实际 读 到 的 字 节 数 。 

POSIX.1 从 几 个 方面 对 read 函数 的 原型 做 了 更 改 。 经 典 的 原型 定义 是 ; 


int read(int fd, char *buf, unsigned nbytes); 


e 首先 ， 为 了 与 ISOC 一 致 ， 第 2 个 参数 由 char * 改 为 void *。 在 ISOC rh, RH void * 
用 于 表示 通用 指针 。 

。 其 次 , 返回 值 必须 是 一 个 带 符号 整 型 (ssize_t), 以 保证 能 够 返回 正 整数 字 节 数 、0( 表 
示 文 件 尾 端 ) 或 一 1 (出错)。 

。 最 后 ， 第 3 个 参数 在 历史 上 是 一 个 无 符号 整 型 ， 这 允许 一 个 16 位 的 实现 一 次 读 或 写 的 数 
据 可 以 多 达 65534 个 字 节 。 在 1990 POSIX.1 标准 中 ， 引 入 了 新 的 基本 系统 数据 类 型 
ssize t 以 提供 带 符号 的 返回 值 , 不 带 符号 的 size_t 则 用 于 第 3 个 参数 ( 见 2.5.2 TH 
的 SSIZE MAX 常量 )。 


3.8 AŽ write 


调用 write 函数 向 打开 文件 写 数据 。 


#include <unistd.h> 





ssize t write(int fd, const void *buf, size t nbytes); 


返回 值 ， 若 成 功 ， 返 回 已 写 的 字 节 数 ; 着 出 错 ， 返 回 -1 
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其 返回 值 通常 与 参数 nbytes 的 值 相同 ,否则 表示 出 错 ,。 write 出 错 的 一 个 常见 原因 是 磁盘 已 
写 满 ， 或 者 超过 了 一 个 给 定 进程 的 文件 长 度 限制 ( 见 7.11 节 及 习题 10.11)。 

对 于 普通 文件 , 写 操作 从 文件 的 当前 偏 移 量 处 开始 。 如 果 在 打开 该 文件 时 , 指定 了 O_APPEND 
选项 ， 则 在 每 次 写 操作 之 前 ， 将 文件 偏 移 量 设置 在 文件 的 当前 结尾 处 。 在 一 次 成 功 写 之 后 ， 该 文 
件 偏 移 量 增加 实际 写 的 字 节 数 。 


3.9 WO 的 效率 
3-5 程序 只 使 用 read 和 write 函数 复制 一 个 文件 。 


#include "apue.h" 
#define BUFFSIZE 4096 


int 
main (void) 
( 
int n; 
char bu£[BUFFSIZE]; 


while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > Q0) 
if (write(STDOUT FILENO, buf, n) !- n) 
err sys("write error"); 


if (n < 0} 
err sys("read error"); 


exit(0); 


图 3-5 将 标准 输入 复制 到 标准 输出 
关于 该 程序 应 注意 以 下 几 点 。 
。 它 从 标准 输入 读 ， 写 至 标准 输出 ， 这 就 假定 在 执行 本 程序 之 前 ， 这 些 标 准 输 入 、 输 出 已 
由 shell 安排 好 。 确 实 ， 所 有 常用 的 UNIX 系统 shell 都 提供 一 种 方法 ， 它 在 标准 输入 上 打 
开 一 个 文件 用 于 读 ， 在 标准 输出 上 创建 (或 重 写 ) 一 个 文件 。 这 使 得 程序 不 必 打 开 输 入 
和 输出 文件 ， 并 允许 用 户 利用 shell 的 WO 重 定向 功能 。 
。 考虑 到 进程 终止 时 ，UNIX 系统 内 核 会 关闭 进程 的 所 有 打开 的 文件 描述 符 ， 所 以 此 程序 并 
不 关闭 输入 和 输出 文件 。 
e 对 UNIX 系统 内 核 而 言 ， 文 本 文件 和 二 进 制 代码 文件 并 无 区 别 ， 所 以 本 程序 对 这 两 种 文 
件 都 有 效 。 
我 们 还 没有 回答 的 一 个 问题 是 如 何 选取 BUFFSIZE 值 。 在 回答 此 问题 之 前 , 让 我 们 先 用 各 种 
不 同 的 BUFFSIZE 值 来 运行 此 程序 。 图 3-6 显示 了 用 20 种 不 同 的 缓冲 区 长 度 ， 读 516 581 760 F 
节 的 文件 所 得 到 的 结果 。 
用 图 3-5 的 程序 读 文 件 ， 其 标准 输出 被 重新 定向 到 /dev/nuli 上 。 此 测试 所 用 的 文件 系统 
是 Linux ext4 MHRA, 其 磁盘 块 长 度 为 4 096 字 节 (磁盘 块 长 度 由 st_blksize 表示 , 在 4.12 
节 中 说 明 其 值 为 4096)。 这 也 证 明了 图 3-6 中 系统 CPU 时 间 的 几 个 最 小 值 差不多 出 现在 
BUFFSIZE 为 4096 及 以 后 的 位 置 ， 继 续 增加 缓冲 区 长 度 对 此 时 间 几 乎 没有 影响 。 
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516 581 760 
258 290 830 
129 145 440 
64 572 720 
32 286 360 
16 143 180 
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图 3-6 Linux 上 用 不 同 缓冲 长 度 进行 读 操作 的 时 间 结 果 
大 多 数 文件 系统 为 改善 性 能 都 采用 某 种 预 读 〈read ahead) 技术 。 当 检测 到 正 进行 顺序 读 取 时 ， 
系统 就 试图 读 入 比 应 用 所 要 求 的 更 多 数据 ， 并 假想 应 用 很 快 就 会 读 这 些 数据 。 预 读 的 效果 可 以 从 
图 3-6 中 看 出 ， 缓 冲 区 长 度 小 至 32 字 节 时 的 时 钟 时 间 与 拥有 较 大 缓冲 区 长 度 时 的 时 钟 时 间 几 乎 一 样 。 


我 们 以 后 还 将 回 到 这 一 实例 上 。3.14 节 将 用 此 说 明 同 步 写 的 效果 ，5.8 节 将 比较 不 带 缓冲 的 
VO 时 间 与 标准 IO 库 所 用 的 时 间 。 


应 当 了 解 ， 在 什么 时 间 对 实施 文件 读 、 写 操作 的 程序 进行 性 能 度量 。 操 作 系 统 试 图 用 高 速 缓存 技术 
:将 相关 文件 放置 在 主 存 中 ， 所 以 如 若 重复 度量 程序 性 能 ， 那 么 后 续 运行 该 程序 所 得 到 的 计时 很 可 能 好 于 
， 第 一 次 。 其 原因 是 ， 第 一 次 运行 使 得 文件 进入 系统 高 速 缓存 ， 后 续 各 次 运行 一 般 从 系统 高 速 缓存 访问 文 
, 件 , 无需 读 、 写 磁盘 。( incore 这 个 词 的 意思 是 在 主 存 中 ， 早 期 计算 机 的 主 存 是 用 铁 氧 体 磁 心 ferrite core ) 
t 做 的 ， 这 也 是 “core dump” 这 个 词 的 由 来 : 程序 的 主 存 镜像 存放 在 磁盘 的 一 个 文件 中 以 便 测 试 诊断 )。 

在 图 3-6 所 示 的 测试 数据 中 ， 不 同 缓冲 区 长 度 的 各 次 运行 使 用 不 同 的 文件 副本 ， 所 以 后 一 次 
. 运行 不 会 在 前 一 次 运行 的 高 速 缓存 中 找到 它 需要 的 数据 。 这 些 文件 都 足够 大 ， 不 可 能 全 部 保留 在 
:高 速 缓存 中 (测试 系统 配置 了 6 GB RAM), 


3.10 ”文件 共享 


UNIX 系统 支持 在 不 同 进程 间 共 享 打开 文件 。 在 介绍 dup 函数 之 前 ， 先 要 说 明 这 种 共享 。 为 
此 先 介绍 内 核 用 于 所 有 VO 的 数据 结构 。 


下 面 的 说 明 是 概念 性 的 , 与 特定 实现 可 能 匹配 , 也 可 能 不 匹配 。 请 参阅 Bach[1986] 对 System V 
‘中 相关 数据 结构 的 讨论 。McKusick 等 [1996] 说 明 4.4BSD 中 的 相关 数据 结构 。McKusick 和 
: Neville-Nell[2005] 对 FreeBSD 5.2 进行 了 介绍 。 对 Solaris 的 类 似 讨论 请 参见 McDougall 和 
”Marno[2007]。Linux 2.6 内 核 体 系 结构 介绍 请 参见 Bovet 和 Cesati[2006]。 
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内 核 使 用 3 种 数据 结构 表示 打开 文件 ， 它 们 之 间 的 关系 决定 了 在 文件 共享 方面 一 个 进程 对 另 
一 个 进程 可 能 产生 的 影响 。 

(1) 每 个 进程 在 进程 表 中 都 有 一 个 记录 项 ， 记 录 项 中 包含 一 张 打开 文件 描述 符 表 ， 可 将 其 视 
为 一 个 矢量 ， 每 个 描述 符 占用 一 项 。 与 每 个 文件 描述 符 相 关联 的 是 : 

a. 文件 描述 符 标志 (close_ on exec， 参 见 图 3-7 和 3.14 节 ); 

b. 指向 一 个 文件 表 项 的 指针 。 

(2) 内 核 为 所 有 打开 文件 维持 一 张 文 件 表 。 每 个 文件 表 项 包含 : 

a. 文件 状态 标志 ( 读 、 写 、 添 写 、 同 步 和 非 阻塞 等 ,关于 这 些 标 志 的 更 多 信息 参见 3.14 节 ); 

b. 当前 文件 偏 移 量 ， 

c， 指 向 该 文件 v 节点 表 项 的 指针 。 

(3) 每 个 打开 文件 (或 设备 ) 都 有 一 个 v 节点 (v-node) 结构 。v 节点 包含 了 文件 类 型 和 对 

此 文件 进行 各 种 操作 函数 的 指针 。 对 于 大 多 数 文件 ，v 节点 还 包含 了 该 文件 的 1 节点 (i-node， 索 

引 节点 )。 这 些 信息 是 在 打开 文件 时 从 磁盘 上 读 入 内 存 的 ， 所 以 ， 文 件 的 所 有 相关 信息 都 是 随时 
可 用 的 。 例 如 ，i 节点 包含 了 文件 的 所 有 者 、 文 件 长 度 、 指 向 文件 实际 数据 块 在 磁盘 上 所 在 位 置 
的 指针 等 (4.14 节 较 详细 地 说 明了 典型 UNIX 系统 文件 系统 ， 并 将 更 多 地 介绍 i 节点 )。 


Linux 没有 使 用 v 节点 ， 而 是 使 用 了 通用 i 节点 结构 。 虽 然 两 种 实现 有 所 不 同 ， 但 在 概念 上 ， 


;Vv 节点 与 1 节点 是 一 样 的 。 两 者 都 指向 文件 系统 特有 的 i 节点 结构 。 
我 们 忽略 了 那些 不 影响 讨论 的 实现 细节 。 例 如 ， 打 开 文 件 描述 符 表 可 存放 在 用 户 空间 (作为 一 
个 独立 的 对 应 于 每 个 进程 的 结构 ， 可 以 换 出 )， 而 非 进程 表 中 。 这 些 表 也 可 以 用 多 种 方式 实现 ， 不 
必 一 定 是 数组 , 例如 , 可 将 它们 实现 为 结构 的 链表 。 如 果 不 考虑 实现 细节 的 话 , 通用 概念 是 相同 的 。 
图 3-7 显示 了 一 个 进程 对 应 的 3 张 表 之 间 的 关系 。 该 进程 有 两 个 不 同 的 打开 文件 ; 一 个 文件 
从 标准 输入 打开 文件 描述 符 0)， 另 一 个 从 标准 输出 打开 《文件 描述 符 为 D. 
进程 表 项 文件 表 项 


文件 家 项 





图 3-7 打开 文件 的 内 核 数 据 结构 


从 UNIX 系统 的 早期 版 本 [Thompson 1978] 以 来 ,这 3 张 表 之 间 的 关系 一 直 保 持 至 今 。 这 种 天 
系 对 于 在 不 同 进 程 之 间 共 享 文件 的 方式 非常 重要 。 在 以 后 的 章节 中 涉及 其 他 文件 共享 方式 时 还 会 
回 到 这 张 图 上 来 。 
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| 创建 v 节点 结构 的 目的 是 对 在 一 个 计算 机 系统 上 的 多 文件 系统 类 型 提供 支持 。 这 一 工作 是 
”Peter Weinberger ( 贝尔 实验 室 ) 和 Bill Joy (Sun 公司 ) 分 别 独立 完成 的 。Sun 把 这 种 文件 系统 称 
为 虚拟 文件 系统 ( Virtual File System ), 把 与 文件 系统 无 关 的 i 节点 部 分 称 为 v 节点 [Kleiman 1986]。 
当 各 个 制造 商 的 实现 增加 了 对 Sun 的 网 络 文件 系统 (NFS ) 的 支持 时 ， 它 们 都 广泛 采用 了 v 节点 
| 结构 。 在 BSD 系列 中 首先 提供 v 节点 的 是 增加 了 NFS 的 4.3BSD Reno, 

在 SVR4 F, v 节点 替代 了 SVR3 中 与 文件 系统 无 关 的 i 节点 结构 。Solaris 是 从 SVR4 发 展 而 
， 来 的 ， 因 此 它 也 使 用 Vv 节点 。 

(Linux 没有 将 相关 数据 结构 分 为 1 节点 和 v 节点 ， 而 是 采用 了 一 个 与 文件 系统 相关 的 i 节点 和 
一 个 与 文件 系统 无 关 的 j 节点 。 


如 果 两 个 独立 进程 各 自打 开 了 同一 文件 ， 则 有 图 3-8 中 所 示 的 关系 。 


i$ eme 


HERA 


文件 表 项 
文件 状态 标志 
HHLA E 





v 节点 指针 







文件 表 项 







图 3-8 ”两 个 独立 进程 各 自打 开 同 一 个 文件 
我 们 假定 第 一 个 进程 在 文件 描述 符 3 上 打开 该 文件 ， 而 男 一 个 进程 在 文件 摘 述 符 4 上 打开 该 文件 。 
打开 该 文件 的 每 个 进程 都 获得 各 自 的 一 个 文件 表 项 ,但 对 一 个 给 定 的 文件 只 有 一 个 v 节点 表 项 。 之 所 
以 每 个 进程 都 获得 自己 的 文件 表 项 ， 是 因为 这 可 以 使 每 个 进程 都 有 它 自 己 的 对 该 文件 的 当前 偏 移 量 。 
给 出 了 这 些 数据 结构 后 ， 现 在 对 前 面 所 述 的 操作 进一步 说 明 。 [76 | 
© 在 完成 每 个 write 后 ， 在 文件 表 项 中 的 当前 文件 偏 移 量 即 增加 所 写 入 的 字 节 数 。 如 果 这 
导致 当前 文件 偏 移 量 超出 了 当前 文件 长 度 , 则 将 i 节点 表 项 中 的 当前 文件 长 度 设置 为 当前 
文件 偏 移 量 〈 也 就 是 该 文件 加 长 了 )。 
。 WRH o APPEND 标志 打开 一 个 文件 ， 则 相应 标志 也 被 设置 到 文件 表 项 的 文件 状态 标志 中 。 
每 次 对 这 种 具有 追加 写 标 志 的 文件 执行 写 操作 时 ， 文 件 表 项 中 的 当前 文件 偏 移 量 首先 会 被 
设置 为 i 节点 表 项 中 的 文件 长 度 。 这 就 使 得 每 次 写 入 的 数据 都 追加 到 文件 的 当前 尾 端 处 。 
。 X -个 文件 用 1seek 定位 到 文件 当前 的 尾 端 , 则 文件 表 项 中 的 当前 文件 偏 移 量 被 设置 为 i 市 
点 表 项 中 的 当前 文件 长 度 (注意 ， 这 与 用 o APPEND 标志 打开 文件 是 不 同 的 , 详 见 3.11 节 )。 
e lseek 函数 只 修改 文件 表 项 中 的 当前 文件 偏 移 量 ， 不 进行 任何 VO 操作 。 
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可 能 有 多 个 文件 描述 符 项 指向 同一 文件 表 项 。 在 3.12 节 中 讨论 daup 函数 时 ， 我 们 就 能 看 到 
这 一 点 。 在 fork 后 也 发 生 同 样 的 情况 ， 此 时 父 进 程 、 子 进程 各 自 的 每 一 个 打开 文件 描述 符 共享 
同一 个 文件 表 项 CML 8.3 节 )。 

注意 ， 文 件 描述 符 标志 和 文件 状态 标志 在 作用 范围 方面 的 区 别 ， 前 者 只 用 于 一 个 进程 的 一 个 
描述 符 , 而 后 者 则 应 用 于 指向 该 给 定 文件 表 项 的 任何 进程 中 的 所 有 描述 符 。 在 3.14 节 说 明 fcnt1 
函数 时 ， 我 们 将 会 了 解 如 何 获取 和 修改 文件 描述 符 标志 和 文件 状态 标志 。 

本 节 前 面 所 述 的 一 切 对 于 多 个 进程 读 取 同 一 文件 都 能 正确 工作 。 每 个 进程 都 有 它 自己 的 文件 
表 项 ， 其 中 也 有 它 自 己 的 当前 文件 偏 移 量 。 但 是 ， 当 多 个 进程 写 同一 文件 时 ， 则 可 能 产生 预想 不 
到 的 结果 。 为 了 说 明 如 何 避 免 这 种 情况 ， 需 要 理解 原子 操作 的 概念 。 


3.11 原子 操作 


1. 追加 到 一 个 文件 
考虑 一 个 进程 ， 它 要 将 数据 追加 到 一 个 文件 尾 端 。 早 期 的 UNIX 系统 版 本 并 不 支持 open 的 
O APPEND 选项 ， 所 以 程序 被 编写 成 下 列 形式 : 


if (lseek(fd,OL, 2) < 0) /*position to EOF*/ 
err sys("lseek error"); 
if (write(fd, buf, 100) !- 100) /*and write*/ 


err sys("write error"); 

对 单个 进程 而 言 ， 这 段 程序 能 正常 工作 ， 但 若 有 多 个 进程 同时 使 用 这 种 方法 将 数据 追加 写 到 
同一 文件 ， 则 会 产生 问题 (例如 ， 若 此 程序 由 多 个 进程 同时 执行 ， 各 自 将 消息 奶 加 到 一 个 日 志 
件 中 ， 就 会 产生 这 种 情况 )。 

假定 有 两 个 独立 的 进程 A 和 B 都 对 同一 文件 进行 追加 写 操作 。 每 个 进程 都 已 打开 了 该 文件 ， 
但 未 使 用 O_APPEND 标志 。 此 时 ， 各 数据 结构 之 闻 的 关系 如 图 3-8 中 所 示 。 每 个 进程 都 有 它 自己 
的 文件 表 项 ， 但 是 共享 一 个 v 节点 表 项 。 假 定 进程 A 调用 了 lseek， 它 将 进程 A 的 该 文件 当前 
偏 移 量 设置 为 1500 字 节 (当前 文件 尾 端 处 )。 然 后 内 核 切 换 进程 ,进程 B 运行 .进程 B 执行 1seek， 
也 将 其 对 该 文件 的 当前 偏 移 量 设置 为 1500 字 节 (当前 文件 尾 端 处 )。 然 后 B WH write, CHB 
的 该 文件 当前 文件 偏 移 量 增加 至 1600。 因 为 该 文件 的 长 度 已 经 增加 了 , 所 以 内 核 将 v 节点 中 的 当 
前 文件 长 度 更 新 为 1600。 然 后, 内核 又 进行 进程 切换 , 使 进程 A KRIST. 23 A 调用 write 时 ， 
就 从 其 当前 文件 偏 移 量 (1500) 处 开始 将 数据 写 入 到 文件 。 这 样 也 就 覆盖 了 进程 B 刚才 写 入 到 该 
文件 中 的 数据 。 

问题 出 在 逻辑 操作 “ 先 定位 到 文件 尾 端 ， 然 后 写 ”， 它 使 用 了 两 个 分 开 的 函数 调用 。 解 决 问题 
的 方法 是 使 这 两 个 操作 对 于 其 他 进程 而 言 成 为 一 个 原子 操作 。 任 何 要 求 多 于 一 个 函数 调用 的 操作 都 
不 是 原子 操作 ， 因 为 在 两 个 函数 调用 之 间 ， 内 核 有 可 能 会 临时 挂 起 进程 (正如 我 们 前 面 所 假定 的 )。 

UNIX 系统 为 这 样 的 操作 提供 了 一 种 原子 操作 方法 ， 即 在 打开 文件 时 设置 0_APPEND 标志 。 
正如 前 一 节 中 所 述 ， 这 样 做 使 得 内 核 在 每 次 写 操作 之 前 ， 都 将 进程 的 当前 偏 移 量 设置 到 该 文件 的 
尾 端 处 ， 于 是 在 每 次 写 之 前 就 不 再 需要 调用 lseek. 

2. MR pread 和 pwrite 

Single UNIX Specification 包括 了 XSI 扩展， 该 扩展 允许 原子 性 地 定位 并 执行 O. preada 和 
pwrite 就 是 这 种 扩展 。 
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#include <unistd.h> 
ssize t pread(int fd, void *buf, size t nbytes, otf t offset); 
返回 值 : 读 到 的 字 节 数 ， 若 已 到 文件 尾 ， 返 回 0; AH, 3X&p]-1 


ssize t pwrite(int fd, const void *buf, size t nbytes, otf t offset); 


返回 值 ; 着 成 功 ， 返 回 已 写 的 字 节 数 ， 若 出 错 ， 返 回 -! 





调用 pread 相当 于 调用 ] seek 后 调用 read, 但 是 pread 又 与 这 种 顺序 调用 有 下 列 重 要 区 别 。 

e 调用 pread 时 ， 无 法 中 断 其 定位 和 读 操 作 。 

。 不 更 新 当前 文件 偏 移 量 。 

调用 pwrite 相当 于 调用 lseek 后 调用 write， 但 也 与 它们 有 类 似 的 区 别 。 

3. 创建 一 个 文件 

对 open MAA o CREAT 和 O_EXCL 选项 进行 说 明 时 , 我 们 已 见 到 另 一 个 有 关 原 子 操作 的 
例子 。 当 同时 指定 这 两 个 选项 ， 而 该 文件 又 已 经 存在 时 ，open 将 失败 。 我 们 曾 提 及 检查 文件 
是 否 存在 和 创建 文件 这 两 个 操作 是 作为 一 个 原子 操作 执行 的 。 如 果 没 有 这 样 一 个 原子 操作 ， 那 
么 可 能 会 编写 下 列 程序 段 : 


if ((fd = open(pathname, O WRONLY)) «0)( 
if (errno == ENOENT) { 
if ((fd = creat(path, mode)) < 0) 
err_sys("creat error"); 
} else[ 
err_sys ("open error"); 
} 
} 


如 果 在 open 和 creat 之 间 ， 另 一 个 进程 创建 了 该 文件 ， 就 会 出 现 问题 。 若 在 这 两 个 郑 数 调用 
之 间 , 另 一 个 进程 创建 了 该 文件 , 并 且 写 入 了 一 些 数据 , 然后 ,原先 进程 执行 这 段 程序 中 的 creat, 
这 时 ， 刚 由 另 一 进程 写 入 的 数据 就 会 被 擦 去 。 如 若 将 这 两 者 合并 在 一 个 原子 操作 中 ， 这 种 问题 
也 就 不 会 出 现 。 

一 般 而 言 ， 原 子 操作 (atomic operation) 指 的 是 由 多 步 组 成 的 一 个 操作 。 如 果 该 操作 原子 地 
执行 ， 则 要 么 执行 完 所 有 步骤 ， 要 么 一 步 也 不 执行 ， 不 可 能 只 执行 所 有 步骤 的 一 个 子 集 。 在 4.15 
节 描 述 link 函数 以 及 在 14.3 节 中 说 明 记 录 锁 时 ， 还 将 讨论 原子 操作 。 


3.12 函数 dup 和 dup2 


下 面 两 个 函数 都 可 用 来 复制 一 个 现 有 的 文件 描述 符 。 


finciude <unistd.h> 


int dup(int fd); 


int dup2(int fd, int fd2); 





由 dup 返回 的 新 文件 描述 符 一 定 是 当前 可 用 文件 描述 符 中 的 最 小 数值 。 对 于 Gup2， 可 以 
用 fa2 参数 指定 新 描述 符 的 值 。 如 果 应 2 已 经 打开 ， 则 先 将 其 关闭 。 如 若 应 等 于 .2， 则 dup2 
返回 和 2， 而 不 关闭 它 。 否 则 ，J42 的 FD CLOEXEC 文件 描述 符 标志 就 被 清除 ， 这 样 f42 在 进程 
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调用 exec 时 是 打开 状态 。 
这 些 函 数 返 回 的 新 文件 描述 符 与 参数 应 共享 同一 个 文件 表 项 ， 如 图 3-9 所 示 。 
进程 表 项 


文件 表 





图 3-9 dup(1) 后 的 内 核 数 据 结构 

在 此 图 中 ， 我 们 假定 进程 启动 时 执行 了 : 

newfd = dup(1); 
当 此 函数 开始 执行 时 ， 假 定 下 一 个 可 用 的 描述 符 是 3〈 这 是 非常 可 能 的 ， 因 为 0，1 和 2 都 由 shell 
打开 )。 因 为 两 个 描述 符 指向 同一 文件 表 项 ， 所 以 它们 共享 同一 文件 状态 标志 《〈 读 、 写 、 仍 加 等 ) 
以 及 同一 当前 文件 偏 移 量 。 

每 个 文件 描述 符 都 有 它 自己 的 一 套 文件 描述 符 标志 。 正 如 我 们 将 在 下 一 节 中 说 明 的 那样 ， 新 
描述 符 的 执行 时 关闭 〈close-on-exec) 标志 总 是 由 dup 函数 清除 。 

复制 一 个 描述 符 的 另 一 种 方法 是 使 用 fcntl 函数 ，3.14 节 将 对 该 函数 进行 说 明 。 实 际 上 ， 
调用 

dup (fd); 
等 效 于 

fentl (fd, F DUPFD, 0); 
而 调用 

dup2(fd, fd2); 
等 效 于 


close(fd2); 
fcntl(fd, F DUPFD, fd2); 


在 后 一 种 情况 下 ，dup2 并 不 完全 等 同 于 close 加 上 fcnt1。 它 们 之 间 的 区 别 具 体 如 下 。 
(D dup2 是 一 个 原子 操作 ， 而 close 和 fcntl 包括 两 个 函数 调用 。 有 可 能 在 close 和 
fcntl 之 间 调 用 了 信号 捕获 函数 ， 它 可 能 修改 文件 描述 符 (第 10 章 将 说 明 信 号 )。 如 果 不 同 的 线 
程 改变 了 文件 描述 符 的 话 也 会 出 现 相同 的 问题 “第 11 章 将 说 明 线 程 。 
(2) dup2 和 fcntl 有 一 些 不 同 的 errno。 


| dup2 系统 调用 起 源 于 V7， 然后 传播 至 所 有 BSD 版 本 。 而 复制 文件 描述 符 的 fontl 方法 则 


| 首先 由 系统 II[ 使 用 ， 然 后 由 System V 继续 采用 。SVR3.2 选用 了 dup2 函数 ，4.2BSD 则 选用 了 
| fontl AHA F DUPFD 功能 。POSIX.1 要 求 兼 有 dup2 A fcntl #5 F DUPFD 两 种 功能 。 
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3.13 BM sync. fsync Hl fdatasyne 


传统 的 UNIX 系统 实现 在 内 核 中 设 有 缓冲 区 高 速 缓存 或 页 高 速 缓存 ， 大 多 数 磁 盘 VO 都 通过 缓冲 
区 进行 。 当 我 们 向 文件 写 入 数据 时 ， 内 核 通 常 先 将 数据 复制 到 缓冲 区 中 ， 然 后 排 入 队列 ， 晚 些 时 候 再 
写 入 磁盘 。 这 种 方式 被 称 为 延迟 写 〈delayed write) (Bachf1986] 的 第 3 章 详 细 讨论 了 缓冲 区 高 速 缓存 )。 

通常 ， 当 内 核 需要 重用 缓冲 区 来 存放 其 他 磁盘 块 数据 时 , 它 会 把 所 有 延迟 写 数据 块 写 入 磁盘 。 
为 了 保证 磁盘 上 实际 文件 系统 与 缓冲 区 中 内 容 的 一 致 性 ，UNIX 系统 提供 了 sync. fsync 和 
fdatasync 三 个 函数 。 


#include<unistd.h> 
int fsync(int fd); 


int fdatasync(int fa); 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 





void sync(void); ' 


sync 只 是 将 所 有 修改 过 的 块 缓冲 区 排 入 写 队 列 ， 然 后 就 返回 ， 它 并 不 等 待 实际 写 磁盘 操作 结束 。 

通常 ， 称 为 update 的 系统 守护 进程 周期 性 地 调用 一般 每 隔 30 秒 ) sync 函数 。 这 就 保证 
TER (flush) 内核 的 块 缓冲 区 。 命 令 sync(1) 也 调用 sync AR. 

fsync 函数 只 对 由 文件 描述 符 启 指定 的 一 个 文件 起 作用 ， 并 且 等 待 写 磁 盘 操 作 结 束 才 返回 。 
fsync 可 用 于 数据 库 这 样 的 应 用 程序 ， 这 种 应 用 程序 需要 确保 修改 过 的 块 立即 写 到 磁盘 上 。 

fdatasync 函数 类 似 于 £sync, 但 它 只 影响 文件 的 数据 部 分 。 而 除数 据 外 ，fsync 还 会 同 
步 更 新 文件 的 属性 。 


本 书 说 明 的 所 有 4 种 平台 都 支持 sync 和 fsync 函数 。 但 是 ,FreeBSD 8.0 不 支持 fdatasync。 


3.14 PAR Ecnt1 
font] 函数 可 以 改变 已 经 打开 文件 的 属性 。 


#include<fentl.h> 
int fcntl(int ja, int cmd, ... /* int arg */): 


返回 值 : BRIA, WERT cmd AF): 若 出 错 ， 返 回 -1 


在 本 节 的 各 实例 中 ， 第 3 个 参数 总 是 一 个 整数 ， 与 上 面 所 示 函 数 原 型 中 的 注释 部 分 对 应 。 但 
是 在 14.3 节 说 明 记 录 锁 时 ， 第 3 个 参数 则 是 指向 一 个 结构 的 指针 。 

font] RAA LUTF 5 种 功能 。 

COD 复制 一 个 已 有 的 描述 符 (cmqd = F DUPFD £& F_DUPFD_CLOEXEC). 

(2) 获取 /设置 文件 描述 符 标志 (cmd = F. GETFD £X F_SETFD). 

(3) 获取 /设置 文件 状态 标志 Cemd = F. GETFL W F_SETFL). 

(4) 获取 /设置 异步 VO 所 有 权 Comd = F_GETOWN ZX F_SETOWN). 

(5) 获取 /设置 记录 锁 (cmd - F GETLK. F SETLK 8% F_SETLKW). 

我 们 先 说 明 这 11 种 cmd 中 的 前 8 种 (14.3 节 说 明 后 3 种 ， 它 们 都 与 记录 锁 有 关 )。 参 照 图 3-7， 我 
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们 将 讨论 与 进程 表 项 中 各 文件 描述 符 相 关联 的 文件 描述 符 标 志 以 及 每 个 文件 表 项 中 的 文件 状态 标志 。 


F_DUPFD 


F DUPFD CLOEXEC 


F GETFD 


F SETFD 


复制 文件 描述 符 应。 新 文件 描述 符 作为 函数 值 返 回 。 它 是 尚未 打开 的 
各 描述 符 中 大 于 或 等 于 第 3 个 参数 值 ( 取 为 整 型 值 ) 中 各 值 的 最 小 值 。 
新 描述 符 与 应 共享 同一 文件 表 项 ( 见 图 3-9)。 但 是 ， 新 描述 符 有 它 
自己 的 一 套 文件 描述 符 标志 ， 其 FD_CLOEXEC 文件 描述 符 标 志 被 清 
除 〈 这 表示 该 描述 符 在 exec 时 仍 保 持 有 效 ， 我 们 将 在 第 8 章 对 此 进 
行 讨论 )。 

复制 文件 描述 符 ， 设 置 与 新 描述 符 关 联 的 FD CLOEXEC 文件 描述 符 标 
志 的 值 ， 返 回 新 文件 描述 符 。 

对 应 于 fd 的 文件 描述 符 标志 作为 函数 值 返 回 。 当 前 只 定义 了 一 个 文件 
描述 符 标志 FD CLOEXEC. 

对 于 万 设置 文件 描述 符 标 志 。 新 标志 值 按 第 3 个 参数 《〈《 取 为 整 型 值 ) 
设置 。 


要 知道 ， 很 多 现 有 的 与 文件 描述 符 标 志 有 关 的 程序 并 不 使 用 常量 FD_CLOEXEC， 而 是 将 此 标 
志 设 置 为 0 ( 系统 默认 ,在 exec 时 不 关闭 ) 或 1( 在 exec 时 关闭 )。 


F GETFL 


对 应 于 应 的 文件 状态 标志 作为 函数 值 返回 。 我们 在 说 明 open 函数 时 ， 
已 描述 了 文件 状态 标志 。 它 们 列 在 图 3-10 中 。 


文件 状态 标志 


O. RDONLY 
O_WRONLY 
O_RDWR 
O EXEC 
O SEARCH 


O APPEND 
O NONBLOCK 
O. SYNC 

O. DSYNC 

O RSYNC 
O_FSYNC 
O_ASYNC 


F SETFL 


F GETOWN 


只 读 打 开 

只 写 打开 

读 、 写 打开 

只 执行 打开 

只 搜索 打开 目录 

追加 写 

JERR ERK 

等 待 写 完 成 “数据 和 属性 ) 

等 待 写 完成 〈 仅 数据 ) 

同步 读 和 写 

等 待 写 完成 〈 仅 FreeBSD 和 Mac OS X) 
异步 VO ({% FreeBSD 和 Mac OS X) 


3-10 对 于 fenti 的 文件 状态 标志 
遗憾 的 是 ,5 个 访问 方式 标志 (O_RDONLY、O_WRONLY、O_RDNWR、O_EXEC 
Li O_SEARCH) 并 不 各 占 1 位 《如 前 所 述 ， 由 于 历史 原因 ， 前 3 个 标 
志 的 值 分 别 是 0、1 和 2。 这 5 个 值 互 斥 ， 一 个 文件 的 访问 方式 只 能 取 
这 5 个 值 之 一 )。 因 此 首先 必须 用 屏蔽 字 0_ACCMODE 取得 访问 方式 位 ， 
然后 将 结果 与 这 5 个 值 中 的 每 一 个 相 比较 。 
将 文件 状态 标志 设置 为 第 3 个 参数 的 值 〈( 取 为 整 型 值 )。 可 以 更 改 的 几 
个 标志 是 : O0_APPEND、O_NONBLOCK、O_SYNC、O_DSYNC、O_RSYNC、 
O FSYNC fil O ASYNC. 
获取 当前 接收 SIGIO 和 srcunc 信和 号 的 进程 ID 或 进程 组 ID. 14.5.2 
节 将 论述 这 两 种 异步 VO fis. 
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F_SETOWN 设置 接收 SIGIO 和 SIGURG 信号 的 进程 ID 或 进程 组 ID。 正 的 arg 指 
定 一 个 进程 ID， 负 的 arg 表示 等 于 arg 绝对 值 的 一 个 进程 组 ID. 
fcntl 的 返回 值 与 命令 有 关 。 如 果 出 错 ， 所 有 命令 都 返回 一 1， 如 果 成 功 则 返回 某 个 其 他 值 。 
下 列 4 个 命令 有 特定 返回 值 : F_DUPFD、F_GETFD、F_GETFL 以 及 F_GETOWN. 3 1 个 命令 返回 
新 的 文件 描述 符 ， 第 2 个 和 第 3 个 命令 返回 相应 的 标志 ， 最 后 一 个 命令 返回 一 个 正 的 进程 ID 或 负 
的 进程 组 ID. 


“实例 


图 3-11 中 所 示 程 序 的 第 1 个 参数 指定 文件 描述 符 ， 并 对 于 该 描述 符 打印 其 所 选择 的 文件 标 
志 说 明 。 


#include "apue.h" 
#include «fcntl.h» 


int 
main(int argc, char *argv[]) 
( 


int val; 


if (argc != 2) 
err quit("usage: a.out <descriptor#>”) ; 


if ((val = fcntl(atoi(argv[1]), F GETFL, 0)) < 0) 
err sys("fcntl error for fd $d", atoi(argv[1])):; 


switch (val & O ACCMODE) ( 

case O RDONLY: 
printf("read only"); 
break; 


case O WRONLY: 
printf("write only"); 
break; 


case O_RDWR: 
printf ("read write"); 
break; 


default: 
err_dump ("unknown access mode"); 


} 


if (val & O_APPEND) 
printf(", append"); 
if (val & O NONBLOCK) 
printf(", nonblocking"); 
if (val & O SYNC) 
printf(", synchronous writes"); 


#if !defined( POSIX C SOURCE) && defined(O FSYNC) && (O FSYNC !- O SYNC) 
if (val & O FSYNC) 
printf(", synchronous writes"); 
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#endif 


putchar ('\n'); 
exit(0); 


3-11 对 于 指定 的 描述 符 打 印 文件 标志 


注意 ， 我 们 使 用 了 功能 测试 宏 _POSIX_C_SOURCE， 并 且 条 件 编 译 了 POSIX.1 中 没有 定义 的 

文件 访问 标志 。 下 面 显示 了 从 bash (Bourne-again shell) 调用 该 程序 时 的 几 种 情况 。 当 使 用 不 同 
shell 时 ， 结 果 会 有 些 不 同 。 

$./a.out 0 < /dev/tty 

read only 

$./a.out 1 » temp.foo 

$ cat temp.foo 

write only 

$./a.out 2 2»»temp.foo 

write only, append 

$./a.out 5 5<>temp. foo 

read write 


TAJ 5<>temp . foo 表示 在 文件 描述 符 5 上 打开 文件 temp. foo 以 供 读 、 写 。 = 


实例 
在 修改 文件 描述 符 标 志 或 文件 状态 标志 时 必须 谨 愤 ， 先 要 获得 现在 的 标志 值 ， 然 后 按照 期 望 修改 
它 ， 最 后 设置 新 标志 值 。 不 能 只 是 执行 F_SETFD 或 F_SETFL 命令 ， 这 样 会 关闭 以 前 设置 的 标志 位 。 
3-12 是 对 于 一 个 文件 找 述 符 设 置 一 个 或 多 个 文件 状态 标志 的 函数 。 


#include "apue.h" 
#include «fcntl.h» 


void 
set fl(int fd, int flags) /* flags are file status flags to turn on */ 
{ 


int val; 


if ((val = fcntl(fd, F GETFL, 0)) < 0) 
err sys("fcntl F GETFL error"); 


val |= flags; /* Enn on flags */ 
if (fcntl(fd, F SETFL, val) < 0) 
err sys("fcntl F SETFL error"); 
图 3-12 对 一 个 文件 描述 符 开启 一 个 或 多 个 文件 状态 标志 
如 果 将 中 间 的 一 条 语句 改 为 : 


val &= ~flags; /* turn flags off */ 


就 构成 另 一 个 函数 ， 我 们 称 为 clr_f1， 并 将 在 后 面 某 些 例子 中 用 到 它 。 此 语句 使 当前 文件 状态 
标志 值 val 与 flags 的 反 码 进行 逻辑 “与 "运算 。 
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如 果 在 图 3-5 程序 的 开始 处 加 上 下 面 一 行 以 调用 set_f1， 则 开启 了 同步 写 标志 。 
set fl(STDOUT FILENO, O SYNC); 


这 就 使 每 次 write 都 要 等 待 ， 直 至 数据 已 写 到 磁盘 上 再 返回 。 在 UNIX 系统 中 ， 通 常 write 只 
是 将 数据 排 入 队列 ， 而 实际 的 写 磁盘 操作 则 可 能 在 以 后 的 某 个 时 刻 进行 。 而 数据 库 系 统 则 需要 使 
用 OQ_SYNC， 这 样 一 来 ， 当 它 从 write 返回 时 就 知道 数据 已 确实 写 到 了 磁盘 上 ， 以 免 在 系统 异 
常 时 产生 数据 丢失 。 

程序 运行 时 ， 设 置 0_SYNC 标志 会 增加 系统 时 间 和 了 时钟 时 间 。 为 了 测试 这 一 点 ， 先 运行 图 3-5 程 
序 ， 它 从 一 个 磁盘 文件 中 将 492.6 MB 的 数据 复制 到 另 一 个 文件 。 然 后 ， 对 比 设置 了 O_SYNC 标志 的 
程序 ， 使 其 完成 同样 的 工作 。 在 使 用 ext4 文件 系统 的 Linux 上 执行 上 述 操作 ， 得 到 的 结果 如 图 3-13 
所 示 。 


取 自 图 3-6 中 BUFFSIZE=4 096 的 读 时 间 
正常 号 到 磁盘 文件 


设置 svNc 后 写 到 磁盘 文件 

写 到 磁盘 后 接着 调用 fdatasync 

写 到 磁盘 后 接着 调用 fsync 

设置 0_SYNC 后 写 到 磁盘 ， 接 着 调用 fsync 


图 3-13 Æ Linux ext4 中 采用 各 种 同步 机 制 后 的 计时 结果 





3-13 中 的 6 行 都 是 在 BUFFSIZE 为 4096 字 节 时 测量 的 。 图 3-6 中 的 结果 所 测量 的 情 
况 是 读 一 个 磁盘 文件 ， 然 后 写 到 /aev/nu1l11， 所 以 没有 磁盘 输出 。 图 3-13 中 的 第 2 行 对 应 于 
读 一 个 磁盘 文件 ， 然 后 写 到 另 一 个 磁盘 文件 中 。 这 就 是 为 什么 图 3-13 中 第 1 行 与 第 2 行 有 差 
别 的 原因 。 在 写 磁 盘 文 件 时 ， 系 统 时 间 增 加 了 ， 其 原因 是 内 核 需 要 从 进程 中 复制 数据 ， 并 将 
数据 排 入 队列 以 便 由 磁盘 驱动 器 将 其 写 到 磁盘 上 。 当 写 至 磁盘 文件 时 ， 我 们 期 望 时 钟 时 间 也 
会 增加 。 

当 支 持 同步 写 时 ， 系 统 时 间 和 时 钟 时 间 应 当 会 显著 增加 。 但 从 第 3 行 可 见 ， 同 步 写 所 用 的 系 
统 时 间 并 不 比 延迟 写 所 用 的 时 间 增 加 很 多 。 这 意味 着 要 么 Linux 操作 系统 对 延迟 写 和 同步 写 操作 
的 工作 量 相 同 ‘这 其 实 是 不 太 可 能 的 )， 要 么 o svNC 标志 并 没有 起 到 期 望 的 作用 。 在 这 种 情况 
F, Linux 操作 系统 并 不 允许 我 们 用 fcnt1 设置 0_SYNC 标志 , 而 是 显示 失败 但 没有 返回 出 错 ( 但 
如 果 在 文件 打开 时 能 指定 该 标志 ， 我 们 还 是 应 该 遵 重 这 个 标志 的 )。 

最 后 3 行 中 的 时 钟 时 间 反 映 了 所 有 写 操 作 写 入 磁盘 时 需要 的 附加 等 待 时 间 。 同 步 写 入 
文件 之 后 ， 我 们 希望 对 fsync 的 调用 并 不 会 产生 效果 。 这 种 情况 理应 在 图 3-13 中 的 最 后 
一 行 中 呈现 ， 但 既然 O SYNC 标志 并 没有 起 到 预期 的 作用 ， 所 以 最 后 一 行 和 第 5 行 的 表现 
几乎 相同 。 

3.14 显示 了 在 采用 urs 文件 系统 的 Mac OS X 10.6.8 上 运行 同样 的 测试 得 到 的 计时 结 
果 。 该 计时 结果 与 我 们 的 期 望 相 符 : 同步 写 比 延迟 写 所 消耗 的 时 间 增 加 了 很 多 ， 而 且 在 同步 
写 后 再 调用 函数 fsync 并 不 产生 测量 结果 上 的 显著 差别 。 还 要 注意 的 是 ， 在 延迟 写 后 增加 一 
个 fsync 函数 调用 ， 测 量 结果 的 差别 也 不 大 。 其 可 能 原因 是 ， 在 向 某 个 文件 写 入 新 数据 时 ， 
操作 系统 已 经 将 以 前 写 入 的 数据 都 冲洗 到 了 磁盘 上 ， 所 以 在 调用 函数 fsync 时 只 需要 做 很 少 
的 工作 。 
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号 到 /dev/null 
EF SIEA 


设置 0_SYNC 后 写 到 磁盘 文件 
写 到 磁盘 后 接着 调用 fsync 
设置 o_sync 后 写 到 磁盘 ， 接 着 调用 fsync 





图 3-14 fE Mac OS X HFS 中 采用 各 种 同步 机 制 后 的 计时 结果 

比较 fsync 和 fdatasync， 两 者 都 更 新 文件 内 容 ， 用 了 o SYNC 标志 ， 每 次 写 入 文件 时 都 
更 新 文件 内 容 。 每 一 种 调用 的 性 能 依赖 很 多 因素 ， 包 括 底层 的 操作 系统 实现 、 磁 盘 驱动 器 的 速度 
以 及 文件 系统 的 类 型 。 = 

在 本 例 中 ， 我 们 看 到 了 £cntl 的 必要 性 。 我 们 的 程序 在 一 个 描述 符 〈 标 准 输出 ) 土 进行 操作 ， 
但 是 根本 不 知道 由 shell 打开 的 相应 文件 的 文件 名 。 因 为 这 是 shell 打开 的 ， 因 此 不 能 在 打开 时 按 我 
们 的 要 求 设置 0_sYNc 标志 。 使 用 fcnt1， 我 们 只 需要 知道 打开 文件 的 描述 符 ， 就 可 以 修改 描述 符 的 
属性 。 在 讲解 非 阻塞 管道 时 (15.2 节 ) 还 会 用 到 fcnt1， 因 为 对 于 管道 ， 我 们 所 知 的 只 有 其 描述 符 。 


3.15 AŽ ioctl 


ioctl 函数 一 直 是 IO 操作 的 杂 物 箱 。 不 能 用 本 章 中 其 他 函数 表示 的 VO 操作 通常 都 能 用 ioct1 
表示 。 终 端 IO 是 使 用 ioctl 最 多 的 地 方 〈 在 第 18 PHAR, POSIX.. 已 经 用 一 些 单独 的 函 
数 代 替 了 终端 VO 操作 )。 


#include <unistd.h> /* System V */ 


#include «sys/ioctl.h» /* BSD and Linux */ 


int ioctl(int fd, int request, ...); 





| ioctl KÆ Single UNIX Specification 标准 的 一 个 扩展 部 分 ,以 便 处 理 STREAMS 设备 [Rago 
| 1993]， 但 是 ， 在 SUSv4 中 已 被 移 至 弃 用 状态 。UNIX 系统 实现 用 它 进行 很 多 条 项 设备 操作 。 有 些 
| 实现 甚至 将 它 扩展 到 用 于 普通 文件 。 


我 们 所 示 的 函数 原型 对 应 于 POSIX.1，FreeBSD 8.0 和 Mac OS X 10.6.8 将 第 2 个 参数 声明 为 
unsigned long。 因 为 第 2 个 参数 总 是 头 文件 中 一 个 #defined 的 名 字 ， 所 以 这 种 细节 并 没有 
什么 影响 。 

对 于 1SOC 原型 ， 它 用 省 略 号 表示 其 余 参 数 。 但 是 ， 通 常 只 有 另外 一 个 参数 ， 它 常常 是 指向 
一 个 变量 或 结构 的 指针 。 

在 此 原型 中 ， 我 们 表示 的 只 是 ioctl 函数 本 身 所 要 求 的 头 文件 。 通 常 ， 还 要 求 另外 的 设 
备 专用 头 文件 。 例 如 ， 除 POSIX.1 所 说 明 的 基本 操作 之 外 ， 终 端 DO 的 ioctl 命令 都 需要 头 
文件 <termios.h>。 

每 个 设备 驱动 程序 可 以 定义 它 自 己 专 用 的 一 组 ioctl 命令 ， 系 统 则 为 不 同 种 类 的 设备 提供 
通用 的 ioctl 命令 。 图 3-15 中 总 结 了 FreeBSD 支持 的 通用 ioctl 命令 的 一 些 类 别 。 
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DIOxxx <sys/disklabel.h> 
FIOxxx <sys/filio.h> 
MTIOxxx <sys/mtio.h> 
SIOxxx <sys/sockio.h> 
TIOxxx <sys/ttycom.h> 


3-15 FreeBSD 中 通用 的 ioctl 操作 
磁带 操作 使 我 们 可 以 在 磁带 上 写 一 个 文件 结束 标志 、 倒 带 、 越 过 指定 个 数 的 文件 或 记录 等 ， 
用 本 章 中 的 其 他 函数 (read. write. lseek 等 ) 都 难于 表示 这 些 操作 ， 所 以 ， 对 这 些 设备 进 
行 操作 最 容易 的 方法 就 是 使 用 ioctl. 
在 18.12 节 中 将 说 明 使 用 ioctl 函数 获取 和 设置 终端 窗口 大 小 ，19.7 节 中 使 用 ioctl 函数 
访问 伪 终 端的 高 级 功能 。 


3.16 /dev/fd 


较 新 的 系统 都 提供 名 为 /dev/fd 的 目录 ， 其 目录 项 是 名 为 0、1、2 等 的 文件 。 打 开 文 件 
/dev/fd/n 等 效 于 复制 描述 符 n〈 假 定 描述 符 n 是 打开 的 )。 
| /dev/fd 这 一 功能 是 由 Tom Duff 开 发 的 ， 它 首先 出 现在 Research UNIX 系统 的 第 8 版 中 ， 
本 书 说 明 的 所 有 4 种 系统 (FreeBSD 8.0, Linux 3.2.0, Mac OS X 10.6.8 和 Solaris 10) 都 支持 这 一 
”功能 。 它 不 是 POSIX.1 的 组 成 部 分 。 
在 下 列 函数 调用 中 : 
fd = open("/dev/fd/0", mode); 
大 多 数 系 统 忽略 它 所 指定 的 mode， 而 另外 一 些 系统 则 要 求 mode 必须 是 所 引用 的 文件 〈 在 这 里 
是 标准 输入 ) 初始 打开 时 所 使 用 的 打开 模式 的 一 个 子 集 。 因 为 上 面 的 打开 等 效 于 
fd = dup(0); 
所 以 找 述 符 0 和 fa 共享 同一 文件 表 项 〈 见 图 3-9)。 例 如 ， 若 措 述 符 0 先前 被 打开 为 只 读 ， 那 么 
我 们 也 只 能 对 £a 进行 读 操作 。 即 使 系统 忽略 打开 模式 ， 而 且 下 列 调用 是 成 功 的 : 
fd = open("/dev/fd/0", O_RDWR); 
我 们 仍然 不 能 对 £a 进行 写 操作 。 
Linux 实现 中 的 /dev/fd 是 个 例外 。 它 把 文件 描述 符 映射 成 指向 底层 物理 文件 的 符号 链接 。 
,例如 ， 当 打开 /dev/fq/0 时 ,事实 上 正在 打开 与 标准 输入 关联 的 文件 ,因此 返回 的 新 文件 描述 符 
”的 模式 与 /dev/fd 文件 描述 符 的 模式 其 实 并 不 相关 。 
我 们 也 可 以 用 /dev/fd 作为 路 径 名 参数 调用 creat, 这 与 调用 open 时 用 o0. cREAT 作为 第 
2 个 参数 作用 相同 。 例 如 ， 若 一 个 程序 调用 creat， 并 且 路 径 名 参数 是 /dev/fd/1， 那 么 该 程序 
仍 能 工作 。 





| id, Æ Linux 上 这 么 做 必须 非常 小 心 。 因 为 Linux 实现 使 用 指向 实际 文件 的 符号 链接 ， 在 
/dev/fa 文 件 上 使 用 creat 会 导致 底层 文件 被 截断 。 
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某 些 系统 提供 路 径 名 /dev/stdin、/dev/stdout 和 /dev/stderr， 这 些 等 效 于 
/dev/fd/0、 /dev/fd/1 和 /dev/fd/2。 

/ dev/£d 文件 主要 由 shell 使 用 ， 它 允许 使 用 路 径 名 作为 调用 参数 的 程序 ， 能 用 处 理 其 他 路 
径 名 的 相同 方式 处 理 标 准 输 入 和 输出 。 例 如 ，cat(1) 命 令 对 其 命令 行 参数 采取 了 一 种 特殊 处 理 ， 
它 将 单独 的 一 个 字符 “- ”解释 为 标准 输入 。 例 如 ， 


filter file2 | cat filel ~ file3 | lpr 


首先 cat 读 filel, 接着 读 其 标准 输入 (也 就 是 filter file2 命令 的 输出 )， 然 后 读 file3， 
如 果 支 持 /dev/fd， 则 可 以 删除 cat 对 “-” 的 特殊 处 理 ， 于 是 我 们 就 可 键入 下 列 命 令 行 : 


filter file2 | cat filel /dev/fd/O file3 | lpr 


作为 命令 行 参数 的 “-” 特 指标 准 输入 或 标准 输出 ， 这 已 由 很 多 程序 采用 。 但 是 这 会 带 来 一 
些 问 题 ， 例 如 ， 如 果 用 “- ”指定 第 一 个 文件 ， 那 么 看 来 就 像 指定 了 命令 行 的 一 个 选项 。/devyfda 
则 提高 了 文件 名 参数 的 一 致 性 ， 也 更 加 清晰 。 


3.17 小结 


本 章 说 明了 UNIX 系统 提供 的 基本 VO 函数。 因为 read 和 write 都 在 内 核 执行 ， 所 以 称 
这 些 函数 为 不 带 缓 冲 的 VO 函数 。 在 只 使 用 read 和 write 情况 下 ， 我 们 观察 了 不 同 的 WO KE 
对 读 文件 所 需 时 间 的 影响 。 我 们 也 观察 了 许多 将 已 写 入 的 数据 冲洗 到 磁盘 上 的 方法 ， 以 及 它们 对 
应 用 程序 性 能 的 影响 。 

在 说 明 多 个 进程 对 同一 文件 进行 追加 写 操作 以 及 多 个 进程 创建 同一 文件 时 ， 本 章 介 绍 了 
原子 操作 。 也 介绍 了 内 核 用 来 共享 打开 文件 信息 的 数据 结构 。 在 本 书 的 稍 后 还 将 涉及 这 些 数 
据 结 构 。 

我 们 还 介绍 了 ioctl Mfcntl1 勇 数 ,本 书后 续 部 分 还 会 涉及 这 两 个 函数 。 第 14 章 还 将 fcnt1 
用 于 记录 锁 ， 第 18 章 和 第 19 BH ioctl 用 于 终端 设备 。 


习题 


3.1 “ 当 读 / 写 磁 盘 文 件 时 ， 本 章 中 描述 的 函数 确实 是 不 带 缓冲 机 制 的 吗 ? 请 说 明 原 因 。 

32 ”编写 一 个 与 3.12 节 中 dup2 功能 相同 的 函数 ， 要 求 不 调用 fonti 函数 ， 并 且 要 有 正确 的 出 
错 处 理 。 

3.3 ”假设 一 个 进程 执行 下 面 3 个 函数 调用 
fdl = open (path, oflags); 


fd2 = dup(fdl); 
fd3 = open(path, oflags); 


Bi th SFA 3-9 的 结果 图 。 对 fcnt1 作用 于 fd1 RH, F_SETFD 命令 会 影响 哪 一 个 文 
件 描述 符 ? F_SETFL We? 
3.4 ”许多 程序 中 都 包含 下 面 一 段 代码 : 


dup2 (fd, 0); 
dup2 (fd, 1); 


3.5 


3.6 
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dup2(fd, 2); 
if (fd » 2) 

close(fd); 
为 了 说 明 if 语句 的 必要 性 ， 假 设 fd 是 1， 通 出 每 次 调用 dup2 时 3 个 描述 符 项 及 相应 的 
文件 表 项 的 变化 情况 。 然 后 再 画 出 £a 为 3 的 情况 。 
在 Bourne shell、Bourne-again shell 和 Korn shell 中 ，digit1>&digit?2 表示 要 将 描述 符 digit! 
重 定 向 至 描述 符 digit2 的 同一 文件 。 请 说 明 下 面 两 条 命令 的 区 别 。 


./a.out > outfile 2»&1 
./a.out 2>&1 > outfile 


(提示 : shell 从 左 到 右 处 理 命令 行 。) 
如 果 使 用 追加 标志 打开 一 个 文件 以 便 读 、 写 ， 能 否 仍 用 lseek 在 任 一 位 置 开 始 读 ? REA 
lseek 更 新 文件 中 任 一 部 分 的 数据 ?请 编写 一 段 程序 验证 。 


文件 和 目录 





4.1 引言 


上 一 章 我 们 说 明了 执行 VO 操作 的 基本 函数 ， 其 中 的 讨论 是 围绕 普通 文件 VO 进行 的 一 一 打开 
文件 、 读 文件 或 写 文 件 。 本 章 将 扒 述 文件 系统 的 其 他 特征 和 文件 的 性 质 。 我 们 将 从 stat 函数 开始 ， 
逐个 说 明 stat 结构 的 每 一 个 成 员 以 了 解 文件 的 所 有 属性 。 在 此 过 程 中 ， 我 们 将 说 明 修改 这 些 属性 
的 各 个 函数 《更 改 所 有 者 、 更 改 权限 等 )， 还 将 更 详细 地 说 明 UNIX 文件 系统 的 结构 以 及 符号 链接 。 
本 章 最 后 介绍 对 目录 进行 操作 的 各 个 函数 ， 并 且 开 发 了 一 个 以 降序 遍历 目录 层次 结构 的 函数 。 


4.2 PAM stat, fstat, fstatat 和 lstat 


本 章 主要 讨论 4 个 stat 函数 以 及 它们 的 返回 信息 。 
#include <sys/stat.h> 
int stat(const char *restrict pathname, struct stat *restrict buf); 
int fstat(int /d, struct stat *buf); 


int lstat(const char *restrict pathname, struct stat *restrict buf); 


int fstatat(int fd, const char *restrict pathname, struct stat *restrict bu int flag); 
BUB 4 TPB: 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 





— ABH pathname, stat 函数 将 返回 与 此 命名 文件 有 关 的 信息 结构 。fstat 函数 获得 已 
在 描述 符 应 上 打开 文件 的 有 关 信 息 。lstat 函数 类 似 于 stat, 但 是 当 命名 的 文件 是 一 个 符号 
链接 时 , 1stat 返回 该 符号 链接 的 有 关 信 息 , 而 不 是 由 该 符号 链接 引用 的 文件 的 信息 。( 在 4.22 
节 中 ， 当 以 降序 遍历 目录 层次 结构 时 ， 需 要 用 到 lstat. 4.17 节 将 更 详细 地 说 明 符 号 链接 。) 

fstatat 函数 为 一 个 相对 于 当前 打开 目录 (由 应 参数 指向 ) 的 路 径 名 返回 文件 统计 信息 。 
flag 参数 控制 着 是 否 跟随 着 一 个 符号 链接 . 当 AT_SYMLINK_NOFOLLOW 标志 被 设置 时 , fstatat 
不 会 跟随 符号 链接 ， 而 是 返回 符号 链接 本 身 的 信息 。 和 否则 ， 在 默认 情况 下 ， 返 回 的 是 符号 链接 所 
指向 的 实际 文件 的 信息 。 如 果 应 参数 的 值 是 AT_FDCWD， 并 且 pathname 参数 是 一 个 相对 路 径 名 ， 
fstatat 会 计算 相对 于 当前 目录 的 pathname SR. WR pathname 是 一 个 绝对 路 径 ,f4 参数 就 会 
被 忽略 。 这 两 种 情况 下 ， 根 据 flag 的 取 值 ，fstatat 的 作用 就 跟 stat 或 1stat -- 样 

第 2 个 参数 buf 是 一 个 指针 ， 它 指向 一 个 我 们 必须 提供 的 结构 。 函 数 来 填充 由 buf 指向 的 结 
构 。 结 构 的 实际 定义 可 能 随 具 体 实现 有 所 不 同 ， 但 其 基本 形式 是 : 


struct stat { 
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mode t st mode; /* file type & mode (permissions) */ 
ino t st ino; /* i-node number (serial number) */ 
dev t st dev; /* device number (file system) */ 

dev t st rdev; /* device number for special files */ 
nlink t st nlink; /* number of links */ 

uid t st uid; /* user ID of owner */ 

gid t st gid; /* group ID of owner */ 

off t st size; /* size in bytes, for regular files */ 
Struct timespec st atime; /* time of last access */ 

Struct timespec st mtime; /* time of last modification */ 
struct timespec st ctime; /* time of last file status change */ 
blksize t st blksize;  /* best I/O block size */ 

blkcnt t st blocks; /* number of disk blocks allocated */ 


E 
: POSIX] && st; rdev. st. blksize 和 st blocks 字段 。Single UNIX Specification XSI 
， 扩展 定义 了 这 些 字段 。 

timespec 结构 类 型 按照 秒 和 纳 秒 定义 了 时 间 ， 宇 少 包括 下 面 两 个 字段 : 


time t tv sec; 
long tv nsec; 


: 在 2008 年 版 以 前 的 标准 中 ， 时 间 字 段 定义 成 st atime. st mtime 以 及 st ctime, © 
们 都 是 time_t 类 型 的 (以 秒 来 表示 )。timespec 结构 提供 了 更 高 精度 的 时 间 规 。 为 了 保持 兼 
l 容 性 ， 旧 的 名 字 可 以 定义 成 tv sec RA. 例如，st_atime 可 以 定义 成 st_atim.tv_sec。 


注意 ，stat 结构 中 的 大 多 数 成 员 都 是 基本 系统 数据 类 型 〈 见 2.8 节 )。 我 们 将 说 明 此 结构 的 
每 个 成 员 以 了 解 文件 属性 。 

使 用 stat 函数 最 多 的 地 方 可 能 就 是 1s -1 命令 ， 用 其 可 以 获得 有 关 一 个 文件 的 所 有 
信息 。 


4.3 文件 类 型 


至 此 我 们 已 经 介绍 了 两 种 不 同 的 文件 类 型 ， 普 通 文件 和 目录 。UNIX 系统 的 大 多 数 文件 是 普 
通 文件 或 和 目录， 但 是 也 有 另外 一 些 文件 类 型 。 文 件 类 型 包括 如 下 几 种 。 
(1) 普通 文件 (regular file)。 这 是 最 常用 的 文件 类 型 ， 这 种 文件 包含 了 某 种 形式 的 数据 。 至 
于 这 种 数据 是 文本 还 是 二 进 制 数据 ， 对 于 UNIX 内 核 而 言 并 无 区 别 。 对 普通 文件 内 容 的 解释 由 处 
理 该 文件 的 应 用 程序 进行 。 
一 全 值得 注意 的 例外 是 二 进 制 可 执行 文件 。 为 了 执行 程序 ， 内 核 必 须 理解 其 格式 。 所 
， 有 二 进 制 可 执行 文件 都 遵循 一 种 标准 化 的 格式 ， 这 种 格式 使 内 核能 够 确定 程序 文本 和 数据 
, 的 加 载 位 置 。 


(2) 目录 文件 (directory file)。 这 种 文件 包含 了 其 他 文件 的 名 字 以 及 指向 与 这 些 文件 有 关 信 
息 的 指针 。 对 一 个 目录 文件 具有 读 权 限 的 任 一 进程 都 可 以 读 该 目录 的 内 容 ， 但 只 有 内 核 可 以 直接 
写 目 录 文 件 。 进 程 必 须 使 用 本 章 介 绍 的 函数 才能 更 改 目 录 。 

(3) 块 特殊 文件 〈block special file)。 这 种 类 型 的 文件 提供 对 设备 〈 如 磁盘 ) 带 缓 冲 的 访问 ， 
每 次 访问 以 固定 长 度 为 单位 进行 。 
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注意 ，FreeBSD 不 再 支持 块 特殊 文件 。 对 设备 的 所 有 访问 需要 通过 字符 特殊 文件 进行 。 


(4) 字符 特殊 文件 (character special file)。 这 种 类 型 的 文件 提供 对 设备 不 带 缓冲 的 访问 ， 每 
侈 访问 长 度 可 变 。 系 统 中 的 所 有 设备 要 么 是 字符 特殊 文件 ， 要 么 是 块 特殊 文件 。 

(5) FIFO。 这 种 类 型 的 文件 用 于 进程 间 通 信 ， 有 时 也 称 为 命名 管道 (named pipe). 15.5 节 将 
对 其 进行 说 明 。 

(6) 套 接 字 〈socket)。 这 种 类 型 的 文件 用 于 进程 闻 的 网 络 通信 。 套 接 字 也 可 用 于 在 一 台 宿 主 
机 上 进程 之 间 的 非 网 络 通信 。 第 16 章 将 用 套 接 字 进 行进 程 间 的 通信 。 

CD 符号 链接 (symbolic link)。 这 种 类 型 的 文件 指向 另 一 个 文件 。4.17 节 将 更 多 地 描述 符号 
链接 。 

文件 类 型 信息 包含 在 stat 结构 的 st mode 成 员 中 。 可 以 用 图 4-1 中 的 宏 确 定 文件 类 型 。 这 

些 宏 的 参数 都 是 stat 结构 中 的 st_mode 成 员 。 


S ISREG() 普通 文件 
S ISDIR() 目录 文件 


S ISCHR() 字符 特殊 文件 
S ISBLK() 块 特 殊 文件 
S ISFIFO() 管道 或 FIFO 


S ISLNK() 符号 链接 
S ISSOCK () EES 


图 4-1 在 <sys/stat.h> 中 的 文件 类 型 宏 
POSIX.1 允许 实现 将 进程 间 通 信 CPC) WH 〈 如 消息 队列 和 信号 量 等 ) 说 明 为 文件 。 图 4-2 中 
的 宏 可 用 来 从 stat 结构 中 确定 IPC 对 象 的 类 型 。 这 些 宏 与 图 4-1 中 的 不 同 ， 它 们 的 参数 并 非 
st_mode， 而 是 指向 stat 结构 的 指针 。 


S TYPEISMQ() 消息 队列 





S TYPEISSEM() 信号 量 
S TYPEISSHM() 共享 存储 对 象 


图 4-2 在 <sys/stat.h> 中 的 IPC 类 型 宏 
消息 队列 、 信 和 号 量 以 及 共享 存储 对 象 等 将 在 第 15 章 中 讨论 。 但 是 ， 本 书 讨 论 的 4 种 UNIX 
系统 都 不 将 这 些 对 象 表示 为 文件 。 





NE: 
图 4-3 程序 取 其 命令 行 参数 ， 然 后 针对 每 一 个 命令 行 参数 打印 其 文件 类 型 。 


#include "apue.h" 


int 
main(int argc, char *argv[]) 
{ 

int i: 

struct stat buf; 

char *ptr; 
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for (i = 1; i < argc; i++) { 
printf("$s: ", argv[i]); 
if (lstat(argvíi], &buf) < 0) ( 
err ret("lstat error"); 
continue; 
) 
if (S ISREG(buf.st mode)) 
ptr = "reqular"; 
else if (S ISDIR(buf.st mode)) 
ptr - "directory"; 
else if (S ISCHR(buf.st mode)) 
ptr = "character special"; 
else if (S ISBLK(buf.st mode)) 
ptr - "block special"; 
else if (S ISFIFO(buf.st mode)) 
ptr = "fifo"; 
else if (S ISLNK(buf.st mode)) 
ptr - "symbolic link"; 
else if (S ISSOCK(buf.st mode)) 
ptr = "socket"; 
else 
ptr - "** unknown mode **"; 
printf ("$s\n", ptr); 
} 
exit(0); 


图 4-3 对 每 个 命令 行 参 数 打印 文件 类 型 
4-3 程序 的 示例 输出 是 : 


$ ./a.out /etc/passwd /etc /dev/log /dev/tty \ 

> /var/lib/oprofiloe/opd pipe /dev/sr0 /dev/cdrom 
/etc/passwd: regular 

fete: directory 

/dev/log: socket 

/dev/tty: character special 
/var/lib/oprofile/opd pipe: fifo 

/dev/sr0: block special 

/dev/cdrom: symbolic link 


(其 中 ,在 第 一 个 命令 行 末端 我 们 键入 了 一 个 反 斜 杠 ， 通知 shell 要 在 下 一 行 继续 键入 命令 ， 然 后 ， 
shell 在 下 一 行 上 用 其 辅助 提示 符 > 提 示 我 们 。〉 我 们 特地 使 用 了 1stat 函数 而 不 是 stat 函数 以 
便 检测 符号 链接 。 如 若 使 用 stat 函数 ， 则 不 会 观察 到 符号 链接 。 E 


早期 的 UNIX 版 本 并 不 提供 S ISxxx Z5 于 是 就 需要 将 st_mode 与 屏蔽 字 S_IFMT HIE 
辑 “ 与 ”运算 ， 然 后 与 名 为 S_IFxxx 的 常量 相 比 较 。 大 多 数 系 统 在 文件 <sys/stat.h> 中 定义 
了 此 屏蔽 字 和 相关 的 常量 。 如 车 查看 此 文件 ， 则 可 找到 S_ISDIR 宏 定义 为 ; 

#define S ISDIR (mode) (((mode) & S IFMT) == S IFDIR) 

我 们 说 过 ， 普 通 文件 是 最 主要 的 文件 类 型 ， 但 是 观察 一 下 在 一 个 给 定 的 系统 中 各 种 文件 的 比 
例 是 很 有 意思 的 。 图 4-4 显示 了 在 一 个 单 用 户 工 作 站 Linux 系统 中 的 统计 值 和 百分比 。 这 些 数 据 
是 由 4.22 节 中 的 程序 得 到 的 。 
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图 4-4 不 同类 型 文件 的 统计 值 和 百分比 


4.4 设置 用 户 ID 和 设置 组 ID 


与 一 个 进程 相关 联 的 ID 有 6 个 或 更 多 ， 如 图 4-5 所 示 。 


实际 用 户 ID 
实际 组 ID 
有 效用 户 ID 


我 们 实际 上 是 谁 


有 效 组 ID 用 于 文件 访问 权限 检查 
附属 组 ID 
保存 的 设置 用 户 ID 
保存 的 设置 组 ID 


由 exec 函数 保存 





4-5 ”与 每 个 进程 相关 联 的 用 户 ID 和 组 ID 


。 实际 用 户 ID 和 实际 组 ID 标识 我 们 究竟 是 谁 。 这 两 个 字段 在 登录 时 取 自 口令 文件 中 的 登 
录 项 。 通 常 ， 在 一 个 登录 会 话 期 间 这 些 值 并 不 改变 ， 但 是 超级 用 户 进程 有 方法 改变 它们 ， 
8.11 节 将 说 明 这 些 方法 。 

© 有 效用 户 ID、 有 效 组 ID 以 及 附属 组 ID 决定 了 我 们 的 文件 访问 权限 ， 下 一 节 将 对 此 进行 
WA CREE 1.8 节 中 说 明了 附属 组 ID )。 

。 保存 的 设置 用 户 ID 和 保存 的 设置 组 ID 在 执行 一 个 程序 时 包含 了 有 效用 户 ID 和 有 效 组 ID 
的 副本 ， 在 8.11 节 中 说 明 setuid 函数 时 ， 将 说 明 这 两 个 保存 值 的 作用 。 


在 POSIX.12001 年 版 中 ， 要 求 这 些 保存 的 ID。 在 早期 POSIX 版 本 中 ， 它 们 是 可 选 的 。 一 个 
”应 用 程序 在 编译 时 可 测试 常量 POSIX_SAVED_IDS, 或 在 运行 时 以 参数 _ SC SAVED IDS 调 
: 用 函数 sysconf， 以 判断 此 实现 是 否 支持 这 一 功能 。 


通常 ， 有 效用 户 ID 等 于 实际 用 户 ID， 有 效 组 ID 等 于 实际 组 ID. 
每 个 文件 有 一 个 所 有 者 和 组 所 有 者 ， 所 有 者 由 stat 结构 中 的 st_uid 指定 ， 组 所 有 者 则 由 
st_gid 指定 。 

当 执行 一 个 程序 文件 时 ,进程 的 有 效用 户 ID 通常 就 是 实际 用 户 ID, 有效 组 ID 通常 是 实际 组 
ID。 但 是 可 以 在 文件 模式 字 〈st_mode) 中 设置 一 个 特殊 标志 ， 其 含义 是 “ 当 执行 此 文件 时 ， 将 
进程 的 有 效用 户 ID 设置 为 文件 所 有 者 的 用 户 ID (st_uid) ”。 与 此 相 类 似 ， 在 文件 模式 字 中 可 
以 设置 另 一 位 ， 它 将 执行 此 文件 的 进程 的 有 效 组 ID 设置 为 文件 的 组 所 有 者 ID (st_gid). £X 
件 模式 字 中 的 这 两 位 被 称 为 设置 用 户 ID (set-user-ID) 位 和 设置 组 ID (set-group-ID) 位 。 

例如 ， 若 文件 所 有 者 是 超级 用 户 ， 而 且 设置 了 该 文件 的 设置 用 户 ID 位 ， 那 么 当 该 程序 文件 
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由 一 个 进程 执行 时 ， 该 进程 具有 超级 用 户 权 限 。 不 管 执 行 此 文件 的 进程 的 实际 用 户 ID 是 什么 ， 
都 会 是 这 样 。 例 如 ，UNIX 系统 程序 passwd(1) 允 许 任 一 用 户 改 变 其 口令 ， 该 程序 是 一 个 设置 用 
PD 程序 。 因 为 该 程序 应 能 将 用 户 的 新 口令 写 入 口令 文件 中 (一般 是 /etc/passwd 或 /etc/ 
shadow)， 而 只 有 超级 用 户 才 具有 对 该 文件 的 写 权限 ， 所 以 需要 使 用 设置 用 户 ID 功能 。 因 为 运 
行 设置 用 户 ID 程序 的 进程 通常 会 得 到 额外 的 权限 ， 所 以 编写 这 种 程序 时 要 特别 谨慎 。 第 8 章 将 
更 详细 地 讨论 这 种 类 型 的 程序 。 

再 回 到 stat AM, REAP ID 位 及 设置 组 ID 位 都 包含 在 文件 的 st mode 值 中 。 这 两 位 
可 分 别 用 常量 S_ISUID 和 S ISGID 测试 。 


4.5 ”文件 访问 权限 


st mode 值 也 包含 了 对 文件 的 访问 权限 位 。 当 提 及 文件 时 ， 指 的 是 前 面 所 提 到 的 任何 类 型 的 
文件 。 所 有 文件 类 型 (目录 、 字 符 特 别 文 件 等 ) 都 有 访问 权限 Caccess permission)。 很 多 人 认为 
只 有 普通 文件 有 访问 权限 ， 这 是 一 种 误解 。 

每 个 文件 有 9 个 访问 权限 位 ， 可 将 它们 分 成 3 28, WE 4-6。 


RP 
APS 
用 户 执行 
组 读 
组 写 

组 执行 
其 他 读 
其 他 写 
其 他 执行 


$_IRUSR 
S_IWUSR 
S_IXUSR 
S IRGRP 
S IWGRP 
S IXGRP 
S IROTH 
S IWOTH 
S IXOTH 





图 4-6 9 个 访问 权限 位 ， 取 自 <sys/stat.h> 
在 图 4-6 前 3 行 中 ， 术 语 用 户 指 的 是 文件 所 有 者 (owner)。chmod(1) 命 令 用 于 修改 这 9 个 权 
限 位 。 该 命令 允许 我 们 用 u 表示 用 户 〈 所 有 者 )， 用 g 表示 组 ， 用 o 表示 其 他 。 有 些 书 把 这 3 种 
用 户 类 型 分 别称 为 所 有 者 、 组 和 世界 。 这 会 造成 混乱 ， 因 为 chmod 命令 用 o 表示 其 他 ， 而 不 是 
所 有 者 。 我 们 将 使 用 术语 用 户 、 组 和 其 他 ， 以 便 与 chmod 命令 保持 一 致 。 
4-6 中 的 3 类 访问 权限 〈 即 读 、 写 及 执行 〉 以 各 种 方式 由 不 同 的 函数 使 用 。 我 们 将 这 些 不 
同 的 使 用 方式 汇总 在 下 面 。 当 说 明 相 关 函 数 时 ， 再 进一步 讨论 。 
e 第 一 个 规则 是 ， 我 们 用 名 字 打 开 任 一 类 型 的 文件 时 ， 对 该 名 字 中 包含 的 每 一 个 目录 ， 包 
括 它 可 能 隐 含 的 当前 工作 目录 都 应 具有 执行 权限 。 这 就 是 为 什么 对 于 目录 其 执行 权限 位 
常 被 称 为 搜索 位 的 原因 。 
例如 , 为 了 打开 文件 /usr/include/stdio.h, 需要 对 目录 /、/usr fli/usr/inciude 
具有 执行 权限 。 然 后， 需要 具有 对 文件 本 身 的 适当 权限 ， 这 取决 于 以 何 种 模式 打开 它 《 只 
读 、 读 - 写 等 )。 
如 果 当 前 目录 是 /usr/include， 那么 为 了 打开 文件 stdio .h， 需 要 对 当前 目录 有 执行 
权限 。 这 是 隐 含 当前 目录 的 一 个 示例 。 打 开 stdio.h 文件 与 打开 . /stdio.h 作用 相同 。 
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注意 ， 对 于 目录 的 读 权限 和 执行 权限 的 意义 是 不 相同 的 。 读 权限 允许 我 们 读 目 录 ， 获 得 在 
该 目录 中 所 有 文件 名 的 列表 。 当 一 个 目录 是 我 们 要 访问 文件 的 路 径 名 的 一 个 组 成 部 分 时 ， 
对 该 目录 的 执行 权限 使 我 们 可 通过 该 目录 《也 就 是 搜索 该 目录 ， 寻 找 一 个 特定 的 文件 名 )。 
引用 隐 含 目录 的 另 一 个 例子 是 ， 如 果 PATH 环境 变量 〈8.10 节 将 对 其 进行 说 明 ) 指定 了 一 
个 我 们 不 具有 执行 权限 的 目录 ， 那 么 shel 绝 不 会 在 该 目录 下 找到 可 执行 文件 。 

。 对 于 一 个 文件 的 读 权限 决定 了 我 们 是 否 能 够 打开 现 有 文件 进行 读 操作 。 这 与 open 函数 的 

O RDONLY 和 O_RDWR 标志 相关 。 
© 对 于 一 个 文件 的 写 权限 决定 了 我 们 是 否 能 够 打开 现 有 文件 进行 写 操作 。 这 与 open 函数 的 
O WRONLY 和 O_RDWR 标志 相关 。 

e 为 了 在 open 函数 中 对 一 个 文件 指定 O. TRUNC 标志 ， 必 须 对 该 文件 具有 写 权 限 。 

e 为 了 在 一 个 且 录 中 创建 一 个 新 文件 ， 必 须 对 该 目录 具有 写 权 限 和 执行 权限 。 

e 为 了 删除 一 个 现 有 文件 ， 必 须 对 包含 该 文件 的 目录 具有 写 权 限 和 执行 权限 。 对 该 文件 本 

身 则 不 需要 有 读 、 写 权限 。 

。 如果 用 7 个 exec 函数 〈 见 8.10 节 ) 中 的 任何 一 个 执行 某 个 文件 ， 都 必须 对 该 文件 具有 

执行 权限 。 该 文件 还 必须 是 一 个 普通 文件 。 

进程 每 次 打开 、 创 建 或 删除 一 个 文件 时 ， 内 核 就 进行 文件 访问 权限 测试 ， 而 这 种 测试 可 能 涉 
及 文件 的 所 有 者 Cst_uid 和 st_gid)、 进 程 的 有 效 一 (有效 用户 ID 和 有 效 组 D) 以 及 进程 的 
附属 组 ID 〈 若 支持 的 话 )。 两 个 所 有 者 ID 是 文件 的 性 质 ， 而 两 个 有 效 ID 和 附属 组 ID 则 是 进程 
的 性 质 。 内 核 进行 的 测试 具体 如 下 。 

CD 若 进程 的 有 效用 户 ID 是 0 (超级 用 户 )， 则 允许 访问 。 这 给 予 了 超级 用 户 对 整个 文件 系 
统 进行 处 理 的 最 充分 的 自由 。 

(2) 若 进程 的 有 效用 户 ID 等 于 文件 的 所 有 者 ID〈 也 就 是 进程 拥有 此 文件 )， 那 么 如 果 所 有 者 
适当 的 访问 权限 位 被 设置 ， 则 允许 访问 ;否则 拒绝 访问 。 适 当 的 访问 权限 位 指 的 是 ， 若 进程 为 读 
而 打开 该 文件 ， 则 用 户 读 位 应 为 1; 车 进程 为 写 而 打开 该 文件 ， 则 用 户 写 位 应 为 1: 若 进程 将 执行 
该 文件 ， 则 用 户 执行 位 应 为 1。 

(3) 若 进程 的 有 效 组 ID 或 进程 的 附属 组 ID 之 一 等 于 文件 的 组 ID. 那么 如 果 组 适当 的 访问 权 
限 位 被 设置 ， 则 允许 访问 ， 否则 拒绝 访问 。 

(4) 若 其 他 用 户 适 当 的 访问 权限 位 被 设置 ， 则 允许 访问 ;否则 拒绝 访问 。 

按 顺序 执行 这 4 步 。 注 意 ， 如 果 进 程 拥有 此 文件 〈 第 2 步 )， 则 按 用 户 访问 权限 批准 或 拒绝 
该 进程 对 文件 的 访问 一 一 不 查看 组 访问 权限 。 类 似 地 ， 若 进程 并 不 拥有 该 文件 。 但 进程 属于 某 个 
适当 的 组 ， 则 按 组 访问 权限 批准 或 拒绝 该 进程 对 文件 的 访问 一 一 不 查看 其 他 用 户 的 访问 权限 。 


4.6 ”新 文件 和 目录 的 所 有 权 


在 第 3 章 中 讲述 用 open 或 creat 创建 新 文件 时 ， 我 们 并 没有 说 明 赋 予 新 文件 的 用 户 ID 和 
组 ID 是 什么 。4.21 节 将 说 明 mkdir 函数 ， 此 时 就 会 了 解 如 何 创建 一 个 新 目录 。 关 于 新 目录 的 所 
有 权 规 则 与 本 节 将 说 明 的 新 文件 所 有 权 规 则 相同 。 

新 文件 的 用 户 ID 设置 为 进程 的 有 效用 户 ID。 关 于 组 ID，POSIX.1 允许 实现 选择 下 列 之 一 作 
为 新 文件 的 组 ID。 

《1》 新 文件 的 组 ID 可 以 是 进程 的 有 效 组 ID. 
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(2) 新 文件 的 组 ID 可 以 是 它 所 在 目录 的 组 ID。 


| FreeBSD 8.0 和 Mac OS X 10.6.8 总 是 使 用 目录 的 组 ID 作为 新 文件 的 组 ID。 有 些 Linux 文件 
i 


， 系 统 使 用 mount(1) 命 令 选项 万 许 在 POSIX 提出 的 两 种 选项 中 进行 选择 。 对 于 Linux 3.2.0 和 


; Solaris 10, 默认 情况 下 , 新 文件 的 组 ID 取决 于 它 所 在 的 目录 的 设置 组 ID 位 是 否 被 设置 。 如 果 该 目录 的 


> 


| 这 一 位 已 经 被 设置 ， 则 新 文件 的 组 ID 设置 为 目录 的 组 D; 否则 新 文件 的 组 ID 设置 为 进程 的 有 效 组 ID。 


使 用 POSIX.1 所 人 允许 的 第 二 个 选项 (继承 目录 的 组 ID ) 使 得 在 某 个 目录 下 创建 的 文件 和 目录 
都 具有 该 目录 的 组 ID。 于 是 文件 和 目录 的 组 所 有 权 从 该 点 向 下 传递 .例如 ,在 Linux 的 /var/mail 
目录 中 就 使 用 了 这 种 方法 。 
: 正如 前 面 提 到 的 ， 这 种 设置 组 所 有 权 的 方法 是 FreeBSD 8.0 和 Mac OS X 10.6.8 系统 默认 的 ， 
: 但 对 于 Linux 和 Solaris 则 是 可 选 的 。 在 Linux 3.2.0 和 Solaris 10 之 下 , 必须 使 设置 组 ID 位 起 作用 。 
.更 进一步 ， 为 使 这 种 方法 能 够 正常 工作 , mkdir 函数 要 自动 地 传递 一 个 目录 的 设置 组 ID 位 (421 
， 节 将 说 明 mkdir 就 是 这 样 做 的 )。 


4.7 BŽ access 和 faccessat 


正如 前 面 所 说 ， 当 用 open 函数 打开 一 个 文件 时 ， 内 核 以 进程 的 有 效用 户 ID 和 有 效 组 ID 
为 基础 执行 其 访问 权限 测试 。 有 时 ， 进 程 也 希望 按 其 实际 用 户 ID 和 实际 组 ID 来 测试 其 访问 能 
力 。 例 如 ， 当 一 个 进程 使 用 设置 用 户 ID 或 设置 组 ID 功能 作为 男 一 个 用 户 (REA) 运行 时 ， 就 
可 能 会 有 这 种 需要 。 即 使 一 个 进程 可 能 已 经 通过 设置 用 户 ID 以 超级 用 户 权 限 运 行 , 它 仍 可 能 想 
验证 其 实际 用 户 能 和 否 访问 一 个 给 定 的 文件 。access 和 faccessat 函数 是 按 实际 用 户 ID 和 实 
际 组 ID 进行 访问 权限 测试 的 。( 该 测试 也 分 成 4 步 ， 这 与 4.5 节 中 所 述 的 一 样 ， 但 将 有 效 改 为 
实际 。) 


include <unistd.h> 


int access(const char *pathname, int mode); 


int faccessat(int fd, const char *pathname, int mode, int flag); 
两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0， 和 车 出 错 ， 返 回 -1 
其 中 ， 如 果 测 试 文件 是 否 已 经 存在 ，mode 就 为 F_OK; Fill mode 是 图 4-7 中 所 列 常量 的 按 位 或 。 


R OK PRN 





W_OK 测试 写 权限 
X_OK 测试 执行 权限 





4-7 access 国 数 的 mode 标志 ， 取 自 <unistd.h> 
faccessat MWS access MATE PRAHA FEAR: 一 种 是 pathname 参数 为 绝对 
路 径 ， 另 一 种 是 应 参数 取 值 为 AT FDCWD 而 pathname 参数 为 相对 路 径 。 否 则 ，faccessat it 
算 相 对 于 打开 目录 (Hh fd BS) pathname. 
flag 参数 可 以 用 于 改变 faccessat 的 行为 ， 如 果 flag 设置 为 AT_ERACCESS， 访 问 检查 用 的 
是 调用 进程 的 有 效用 户 ID 和 有 效 组 ID， 而 不 是 实际 用 户 ID 和 实际 组 ID. 
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实例 


4-8 显示 了 access 函数 的 使 用 方法 。 


#include "apue.h" 
#include <fentl.h> 


int 


main(int argc, char *argv[{]) 


{ 


if (argc !- 2) 
err quit("usage: a.out <pathname>"); 
if (access(argv[1], R OK) < 0) 
err_ret ("access error for %s", argv[1]): 
else 
printf("read access OK\n"); 
if (open(argv[1], O RDONLY) < 0) 
err_ret ("open error for %s", argv[í1]); 





else 
printf("open for reading OK\n"); 
exit (0); 
} 
图 4-8 access 函数 实例 
下 面 是 该 程序 的 示例 会 话 : 
$ 1s -1 s.out 
-rwxrwxr-x 1 sar 15945 Nov 30 12:10 a.out 


$ ./a.out a.out 

read access OK 

open for reading OK 

$ ls -1 /etc/shadow 

-TY-------- 1 root 1315 Jul 17 2002 /etc/shadow 
S ,/a.out /etc/shadow 

access error for /etc/shadow: Permission denied 

open error for /etc/shadow: Permission denied 


$ su 成 为 超级 用 户 

Password: 输入 起 级 用 户口 令 

# chown root a.out 将 文件 用 户 ID 改 为 root 

# chmod u*s a.out 并 打开 设置 用 户 ID 位 

# 1s -1 a.out 检查 所 有 者 和 SUID 位 
-rwsrwxr-x 1 root 15945 Nov 30 12:10 a.out 
# exit 恢复 为 正常 用 户 


$ ./a.out /etc/shadow 
access error for /etc/shadow: Permission denied 
open for reading OK 


在 本 例 中 , 尽管 open 函数 能 打开 文件 , 但 通过 设置 用 户 ID 程序 可 以 确定 实际 用 户 不 能 正常 


读 指定 的 文件 。 B 


在 上 例 及 第 8 章 中 ， 我 们 有 时 要 成 为 超级 用 户 ， 以 便 演 示 某 些 功 能 是 如 何 工作 的 。 如 果 你 使 
| 用 多 用 户 系统 ， 但 无 超级 用 户 权限 ， 那 么 你 就 不 能 完整 地 重复 这 些 实例 。 
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4.8 PAS umask 


至 此 我 们 已 说 明了 与 每 个 文件 相关 联 的 9 个 访问 权限 位 ， 在 此 基础 上 我 们 可 以 说 明 与 每 个 进 
程 相关 联 的 文件 模式 创建 屏蔽 字 。 

umask 函数 为 进程 设置 文件 模式 创建 屏蔽 字 ， 并 返回 之 前 的 值 。( 这 是 少数 几 个 没有 出 错 返 
回 函 数 中 的 一 个 。) 


#include <sys/stat.h> 
mode t umask (mode t cmask) ; 
返回 值 ， 之 前 的 文件 模式 创建 屏蔽 字 


其 中 ， 参 数 cmask 是 由 图 4-6 中 列 出 的 9 个 常量 (S. IRUSR. S IWUSR 等 ) 中 的 若干 个 按 位 
4€ 或 ” 构成 的 

在 进程 创建 一 个 新 文件 或 新 目录 时 ， 就 一 定 会 使 用 文件 模式 创建 屏蔽 字 〈 回 忆 3.3 节 和 3.4 
节 ， 在 那里 我 们 说 明了 open 和 creat 函数 。 这 两 个 函数 都 有 一 个 参数 mode， 它 指定 了 新 文件 
的 访问 权限 位 》。 我 们 将 在 4.21 节 说 明 如 何 创 建 一 个 新 目录 。 在 文件 模式 创建 屏蔽 字 中 为 1 的 位 ， 
在 文件 mode 中 的 相应 位 一 定 被 关闭 。 


5 实例 


图 4-9 程序 创建 了 两 个 文件 ， 创 建 第 一 个 时 ，umask 值 为 0， 创建 第 二 个 时 ，umask 值 禁 止 
所 有 组 和 其 他 用 户 的 访问 权限 。 


#include "apue.h" 
#include «fcntl.h» 


$define RWRWRW (S IRUSR|S IWUSR|S IRGRP|S IWGRP|S IROTH[S IWOTH) 


int 
main {void) 
{ 
umask (0) ; 
if (creat("foo", RWRWRW) < O0) 
err sys("creat error for foo"); 
umask(S IRGRP | S IWGRP | S IROTH | S_IWOTH); 
if (creat("bar", RWRWRW) < 0) 
err sys("creat error for bar"); 
exit (0); 


4-9 umask BRE 


若 运行 此 程序 可 得 如 下 结果 ， 从 中 可 见 访 问 权 限 位 是 如 何 设置 的 。 
$ umask 先 打 印 当 前 文件 模式 创建 屏蔽 字 

002 

$ ./a.out 

$ ls -1 foo bar 

-YW----—-— 1 sar 0 Dec 7 21:20 bar 


-rw-rw-rw- 1 sar 0 Dec 7 21:20 foo 
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$ umask 观察 文件 模式 创建 屏蔽 字 是 否 更 改 

002 Nu 

UNIX 系统 的 大 多 数 用 户 从 不 处 理 他 们 的 umask 值 。 通 常 在 登录 时 ， 由 shell 的 启动 文件 设 
置 一 次 ， 然 后 ， 再 不 改变 。 尽 管 如 此 ， 当 编写 创建 新 文件 的 程序 时 ， 如 果 我 们 想 确 保 指 定 的 访问 
权限 位 已 经 激活 ， 那 么 必须 在 进程 运行 时 修改 umask 值 。 例 如 ， 如 果 我 们 想 确 保 任何 用 户 都 能 
读 文件 ， 则 应 将 umask 设置 为 0。 否则 ， 当 我 们 的 进程 运行 时 ， 有 效 的 umask 值 可 能 关闭 该 权 
限 位 。 

在 前 面 的 示例 中 , 我 们 用 shell 的 umask 命令 在 运行 程序 的 前 、 后 打印 文件 模式 创建 屏蔽 字 。 
从 中 可 见 , 更 改进 程 的 文件 模式 创建 屏蔽 字 并 不 影响 其 父 进程 (常常 是 shell? 的 屏蔽 字 。 所 有 shell 
MAAS umask 命令 ， 我 们 可 以 用 该 命令 设置 或 打印 当前 文件 模式 创建 屏蔽 字 。 

用 户 可 以 设置 umask 值 以 控制 他 们 所 创建 文件 的 默认 权限 。 该 值 表示 成 八进制 数 ， 一 位 
代表 一 种 要 屏蔽 的 权限 ， 这 示 于 图 4-10 中 。 设 置 了 相应 位 后 ， 它 所 对 应 的 权限 就 会 被 拒绝 。 
常用 的 几 种 umask 值 是 002. 022 和 027. 002 阻止 其 他 用 户 写 入 你 的 文件 ，022 阻止 同 组 
成 员 和 其 他 用 户 写 入 你 的 文件 , 027 阻止 同 组 成 员 写 你 的 文件 以 及 其 他 用 户 读 、 写 或 执行 你 的 
文件 。 





4-10 umask 文件 访问 权限 位 


Single UNIX Specification 要 求 shell 应 该 支持 符号 形式 的 umask 命令 。 与 八进制 格式 不 同 ， 
符号 格式 指定 许可 的 权限 〈 即 在 文件 创建 屏蔽 字 中 为 0 的 位 ) 而 非 拒绝 的 权限 〈 即 在 文件 创建 屏 
WES 1 的 位 )。 下 面 显 示 了 两 种 格式 的 命令 。 


$ umask 先 打 印 当 前 文件 模式 创建 屏蔽 字 
002 

$ umask -S 打印 符号 格式 
u-rwX,g-rWwX,O0-rXx 

$ umask 027 更 改 文件 模式 创建 屏蔽 字 

$ umask -S 打印 符号 格式 


u-rwx,Gg-rx,o- 


4.9 PR chmod, fchmod 和 fchmodat 


chmod. fchmod 和 fchmodat 这 3 个 函数 使 我 们 可 以 更 改 现 有 文件 的 访问 权限 。 


#include <sys/stat.h> 
int chmod(const char *pathname, mode t mode) ; 
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int fchmod(int/d, mode t mode): 


int fchmodat (int fd, const char *pathname, mode t mode, int flag); 
3 个 函数 返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 --1 


chmod 函数 在 指定 的 文件 上 进行 操作 ， 而 fchmod 函数 则 对 已 打开 的 文件 进行 操作 。 
fchmodat 函数 与 chmod 函数 在 下 面 两 种 情况 下 是 相同 的 : 一 种 是 pathname 参数 为 绝对 路 径 ， 
另 一 种 是 应 参数 取 值 为 AT_FDCWD 而 pathname 参数 为 相对 路 径 。 否 则 ，fchmodat 计算 相对 于 
打开 目录 (由 万 参数 指向 ) 的 pathname. flag 参数 可 以 用 于 改变 £chmodat 的 行为 ， 当 设置 了 
AT SYMLINK, NOFOLLOW 标志 时 ，fchmodat 并 不 会 跟随 符号 链接 。 

为 了 改变 一 个 文件 的 权限 位 ， 进 程 的 有 效用 户 ID 必须 等 于 文件 的 所 有 者 ID， 或 者 该 进程 必 
须 具有 超级 用 户 权限 。 

参数 mode 是 图 4-11 中 所 示 常 量 的 按 位 或 。 


| | WE ls 


S ISUID 执行 时 设置 用 户 ID 

S ISGID 执行 时 设置 组 ID 

S ISVTX 保存 正文 《粘着 位 ) 

AP (所 有 者 ) 读 、 写 和 执 
行 





S IRWXU 


S IRUSR AP (RER) X 
S IWUSR AF (所 有 者 ) 5 
S IXUSR AP (所 有 者 ) 执行 
S_IRWXG 
S_IRGRP 
S_IWGRP 
S_IXGRP 
S_IRWXO 
S IROTH 
S IWOTH 
S IXOTH 


图 4-11 chmod 函数 的 mode 常量 ， 取 自 <sys/stat.h> 
注意 ， 在 图 4-11 中 ， 有 9 项 是 取 自 图 4-6 中 的 9 个 文件 访问 权限 位 。 我 们 另外 加 了 6 个 ， 它 
EASES ID 常量 (Ss_ISUID 和 S_TSGID)、 人 保存 正文 常量 (S_ISVTX) 以 及 3 个 组 合 常量 
(S IRWXU. S IRWXG 和 S_IRWXO). 





保存 正文 位 (S_ISVTX ) 不 是 POSIX.] 的 一 部 分 。 在 Single UNIX Specification 中 ， 它 被 定义 
在 XSI 扩展 中 。 我 们 在 下 一 节 说 明 其 目的 。 


PEAL 
为 了 演示 umask 函数 ， 我 们 在 前 面 运行 了 图 4-9 程序 ， 先 让 我 们 回忆 文件 foo 和 bar 当时 
的 最 后 状态 : 


$ ls -1 foo bar 
-Yw------- 1 sar 0 Dec 7 21:20 bar 
-rw-rw-rw- l sar 0 Dec 7 21:20 foo 
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图 4-12 的 程序 修改 了 这 两 个 文件 的 模式 。 


#include "apue.h" 


int 
main (void) 
{ 
struct stat statbuf; 


/* turn on set-group-ID and turn off group-execute */ 


if (stat("foo", &statbuf) < 0) 
err sys("stat error for foo"); 

if (chmod("foo", (statbuf.st mode & -S IXGRP) | S ISGID) < 0) 
err sys("chmod error for foo"); 


/* set absolute mode to "rw-r--r--" */ 


if (chmod("bar", S IRUSR | S IWUSR | S_IRGRP | S IROTH) < 0) 
err sys('"chmod error for bar"); 
exit (0); 


图 4-12 chmod 函数 实例 
在 运行 图 4-12 程序 后 ， 这 两 个 文件 的 最 后 状态 是 ; 


$ ls -1 foo bar 
-rw-r--r-- 1 sar 0 Dec 7 21:20 bar 
—-rw-rwSrw- 1 sar 0 Dec 7 21:20 foo 


在 本 例 中 ， 不 管 文件 bar 的 当前 权限 位 如 何 ， 我 们 都 将 其 权限 设置 为 一 个 绝对 值 。 对 文件 foo, 

我 们 相对 于 其 当前 状态 设置 权限 。 为 此 ， 先 调用 stat 获得 其 当前 权限 ， 然 后 修改 它 。 我 们 显 式 

地 打开 了 设置 组 ID 位 、 关 闭 了 组 执行 位 。 注 意 ，1s 命令 将 组 执行 权限 表示 为 S， 它 表示 设置 组 
ID 位 已 经 设置 ， 同 时 ， 组 执行 位 未 设置 。 


在 Solaris 中 ，1s 命令 显示 1 而 非 S， 这 表明 对 该 文件 可 以 加 强制 性 文件 或 记录 锁 。 这 只 能 
C 用 于 普通 文件 ，14.3 节 将 更 详细 地 讨论 这 一 点 。 > 


最 后 还 要 注意 , 在 运行 图 4-12 程序 后 ,1s 命令 列 出 的 时 间 和 日 期 并 没有 改变 。 在 4.19 TH, 
我 们 会 了 解 到 chmod 函数 更 新 的 只 是 i 节点 最 近 一 次 被 更 改 的 时 间 。 按 系统 默认 方式 ，1s -1 
列 出 的 是 最 后 修改 文件 内 容 的 时 间 。 

chmod 函数 在 下 列 条 件 下 自动 清除 两 个 权限 位 。 

e Solaris 等 系统 对 用 于 普通 文件 的 粘着 位 赋予 了 特殊 含义 ， 在 这 些 系 统 上 如 果 我 们 试图 设 

署 普 通 文件 的 粘着 位 〈S_ISVTX)7， 而 且 又 没有 超级 用 户 权限 ， 那 么 mode 中 的 粘着 位 自 
动 被 关闭 〈 我 们 将 在 下 一 节 说 明 粘 着 位 )。 这 意味 着 只 有 超级 用 户 才 能 设置 普通 文件 的 粘 
着 位 。 这 样 做 的 理由 是 防止 恶意 用 户 设置 粘着 位 ， 由 此 影响 系统 性 能 。 


在 FreeBSD 8.0 和 Solaris 10 中 ， 只 有 超级 用 户 才能 对 普通 文件 设置 粘着 位 。Linux 3.2.0 
| fo Mac OS X 10.6.8 对 设置 粘着 位 并 无 此 种 限制 ,其 原因 是 , 丫 着 位 对 Linux 普通 文件 并 无 意 
| Lo 虽然 粘着 位 对 FreeBSD 的 普通 文件 也 无 意义 ,但 还 是 阻止 除 超 级 用 户 以 外 的 任何 用 户 对 
| 普通 文件 设置 该 位 。 
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。 新 创建 文件 的 组 ID 可 能 不 是 调用 进程 所 属 的 组 。 回 忆 一 下 4.6 节 ， 新 文件 的 组 ID 
可 能 是 父 目 录 的 组 ID。 特 别 地 ， 如 果 新 文件 的 组 ID 不 等 于 进程 的 有 效 组 ID 或 者 进 
程 附属 组 ID 中 的 一 个 ， 而 且 进 程 没 有 超级 用 户 权 限 ， 那 么 设置 组 ID 位 会 被 自动 被 
关闭 。 这 就 防止 了 用 户 创建 一 个 设置 组 ID 文件 ， 而 该 文件 是 由 并 非 该 用 户 所 属 的 组 
拥有 的 。 


| 这 种 情况 下 ，FreeBSD 8.0 对 试图 设置 组 ID 的 操作 肯定 会 返回 失败 ， 而 其 他 的 系统 则 无 

声息 地 关闭 该 位 ， 但 不 会 对 试图 改变 文件 访问 权限 的 操作 直接 做 失败 处 理 。 

FreeBSD 8.0、Linux 3.2.0, Mac OS X 10.6.8 和 Solaris 10 增加 了 另 一 个 安全 性 功能 以 试 
图 阻止 误 用 某 些 保护 位 。 如 果 没 有 超级 用 户 权限 的 进程 写 一 个 文件 ， 则 设置 用 户 ID 位 和 设 

 X€8ID 位 会 被 自动 清除 。 如 果 和 恶意 用 户 找 到 一 个 他 们 可 以 写 的 设置 组 ID 和 设置 用 户 ID X 

， 件 ， 即 使 可 以 修改 此 文件 ， 他 们 也 没有 对 该 文件 的 特殊 权限 。 


4.10 ”粘着 位 


S ISVTX 位 有 一 段 有 趣 的 历史 。 在 UNIX 尚未 使 用 请 求 分 页 式 技 术 的 早期 版 本 中 , S ISVTX 
位 被 称 为 粘着 位 (sticky bit)。 如 果 一 个 可 执行 程序 文件 的 这 一 位 被 设置 了 ， 那 么 当 该 程序 第 一 次 
被 执行 , 在 其 终止 时 , 程序 正文 部 分 的 一 个 副本 仍 被 保存 在 交换 区 (程序 的 正文 部 分 是 机 器 指令 )。 
这 使 得 下 次 执行 该 程序 时 能 较 快 地 将 其 装载 入 内 存 。 其 原因 是 : 通常 的 UNIX 文件 系统 中 ， 文 件 
的 各 数据 块 很 可 能 是 随机 存放 的 ， 相 比较 而 言 ， 交 换 区 是 被 作为 一 个 连续 文件 来 处 理 的 。 对 于 通 
用 的 应 用 程序 , 如 文本 编辑 程序 和 C 语言 编译 器 , 我 们 常常 设置 它们 所 在 文件 的 粘着 位 。 自 然 地 ， 
对 于 在 交换 区 中 可 以 同时 存放 的 设置 了 粘着 位 的 文件 数 是 有 限制 的 ， 以 免 过 多 占用 交换 区 空间 ， 
但 无 论 如 何 这 是 一 个 有 用 的 技术 。 因 为 在 系统 再 次 自 举 前 ， 文 件 的 正文 部 分 总 是 在 交换 区 中 ， 这 
正 是 名 字 中 “粘着 ”的 由 来 。 后 来 的 UNIX 版 本 称 它 为 保存 正文 位 (saved-text bit)， 因 此 也 就 有 
了 常量 S_ISVTX. 现今 较 新 的 UNIX 系统 大 多 数 都 配置 了 虚拟 存储 系统 以 及 快速 文件 系统 ， 所 以 
不 再 需要 使 用 这 种 技术 。 

现今 的 系统 扩展 了 粘着 位 的 使 用 范围 ，Single UNIX Specification 允许 针对 目录 设置 粘着 位 。 
如 果 对 一 个 目录 设置 了 粘着 位 ， 只 有 对 该 目录 具有 写 权 限 的 用 户 并 且 满 足下 列 条 件 之 一 ， 才 能 删 
除 或 重 命名 该 目录 下 的 文件 : 

。 拥有 此 文件 ; 

。 拥有 此 目录 ，; 

。 是 超级 用 户 。 

目录 /tmp 和 /var/tmp 是 设置 粘着 位 的 典型 候选 者 一 一 任何 用 户 都 可 在 这 两 个 目录 
中 创建 文件 。 任 一 用 户 (用 户 、 组 和 其 他 ) 对 这 两 个 县 录 的 权限 通常 都 是 读 、 写 和 执行 。 
但 是 用 户 不 应 能 删除 或 重 命名 属于 其 他 人 的 文件 ， 为 此 在 这 两 个 目录 的 文件 模式 中 都 设置 
了 粘着 位 。 


POSIX.1 没有 定义 保存 正文 位 , Single UNIX Specification 将 它 定 义 在 XSI 扩展 部 分 。FreeBSD 
8.0. Linux 3.2.0, Mac OS X 10.6.8 和 Solaris 10 则 支持 这 种 功能 。 

Æ Solaris 10 中 ， 如 果 对 普通 文件 设置 了 粘着 位 ， 那 么 它 就 具有 特殊 含义 。 在 这 种 情况 下 ， 如 
果 任 何 执行 位 都 没有 设置 ， 那 么 操作 系统 就 不 会 缓存 文件 内 容 。 
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4.11 AŽ chown, fchown. fchownat 和 lchown 


下 面 几 个 chown 函数 可 用 于 更 改 文件 的 用 户 ID 和 组 ID. 如果 两 个 参数 owner 或 group 中 的 
任意 一 个 是 -1， 则 对 应 的 ID 不 变 。 


#include <unistd.h> 


int chown(const char *pathname, uid_t owner, gid_t group); 


int fchown{int fd, uid t owner, gid t group): 
int fchownat (int fd, const char *pathname, uid t owner, gid t group, int flag); 


int lchown(const char *pathname, uid t owner, gid t group); 





除了 所 引用 的 文件 是 符号 链接 以 外 ， 这 4 个 函数 的 操作 类 似 。 在 符号 链接 情况 下 ，1Lchown 
和 fchownat (设置 了 AT SYMLINK NOFOLLOW 标志 ) 更 改 符号 链接 本 身 的 所 有 者 ， 而 不 是 该 
符号 链接 所 指向 的 文件 的 所 有 者 。 

fchown 请 数 改变 /4 参数 指 问 的 打开 文件 的 所 有 者 ， 既 然 它 在 一 个 已 打开 的 文件 上 操作 ， 就 
不 能 用 于 改变 符号 链接 的 所 有 者 。 

fchownat 函数 与 chown 或 者 lchown 函数 在 下 面 两 种 情况 下 是 相同 的 : 一 种 是 pathname 
参数 为 绝对 路 径 ， 另 一 种 是 应 参数 取 值 为 AT_FDCWD 而 pathname 参数 为 相对 路 径 。 在 这 两 种 情 
况 下 , 如果 flag 参数 中 设置 了 AT_SYMLINK_NOFOLLOW 标志 ，fchownat 与 1chown 行为 相同 ， 
如 果 flag 参数 中 清除 了 AT SYMLINK NOFOLLOW 标志 ， 则 fchownat 与 chown 行为 相同 。 如 
果 应 参 数 设 置 为 打开 目录 的 文件 描述 符 ， 并 且 pathname 参数 是 一 个 相对 路 径 名 ，fchownat ER 
数 计算 相对 于 打开 目录 的 pathname. 

基于 BSD 的 系统 一 直 规 定 只 有 超级 用 户 才能 更 改 一 个 文件 的 所 有 者 。 这 样 做 的 原因 是 防止 用 
户 改变 其 文件 的 所 有 者 从 而 摆脱 磁盘 空间 限额 对 他 们 的 限制 。System V 则 允许 任 一 用 户 更 改 他 们 
所 拥有 的 文件 的 所 有 者 。 


按照 _ POSIX_CHOWN_RESTRICTED 的 值 ，POSIX.1 允许 在 这 两 种 形式 的 操作 中 选用 一 种 。 
对 于 Solaris 0， 此 功能 是 个 配置 选项 ， 其 默认 值 是 施加 限制 。 而 FreeBSD 8.0、Linux 3.2.0 
f$» Mac OS X 10.6.8 则 总 对 chown 施加 限制 。 


回忆 2.6 节 ，_POSIX_CHOWN_RESTRICTED 常量 可 选 地 定义 在 头 文件 <unistd.h> 中 ， 而 且 
总 是 可 以 用 pathconf E £pathconf 函数 进行 查询 ,此 选项 还 与 所 引用 的 文件 有 关 一 一 可 在 每 个 
文件 系统 基础 上 ， 使 该 选项 起 作用 或 不 起 作用 。 在 下 文中 ， 如 握 及 “ 若 _POSIX_CHOWN_ 
RESTRICTED 生效 ”,， 则 表示 “这 适用 于 我 们 正在 谈 及 的 文件 ”， 而 不 管 该 实际 常量 是 否 在 头 文 件 
中 定义 。 

d$ POSIX CHOWN RESTRICTED 对 指定 的 文件 生效 ， 则 

(1) 只 有 超级 用 户 进程 能 更 改 该 文件 的 用 户 ID: 

(2) 如果 进程 拥有 此 文件 《其 有 效用 户 ID 等 于 该 文件 的 用 户 ID), BRM owner 等 于 -1 RX 
件 的 用 户 ID， 并 且 参 数 group 等 于 进程 的 有 效 组 ID 或 进程 的 附属 组 ID 之 一 ,那么 一 个 非 超级 用 
户 进程 可 以 更 改 该 文件 的 组 ID。 
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这 意味 着 ， 当 _POSIX_CHOWN_RESTRICTED 有 效 时 ， 不 能 更 改 其 他 用 户 文件 的 用 户 ID。 你 
可 以 更 改 你 所 拥 用 的 文件 的 组 ID， 但 只 能 改 到 你 所 属 的 组 。 
如 果 这 些 函 数 由 非 超 级 用 户 进程 调用 ， 则 在 成 功 返 回 时 ， 该 文件 的 设置 用 户 ID 位 和 设置 组 
ID 位 都 被 清除。 


4.12 文件 长 度 


stat 结构 成 员 st_size 表示 以 字 节 为 单位 的 文件 的 长 度 。 此 字段 只 对 普通 文件 、 目 录 文 件 
和 符号 链接 有 意义 。 


FreeBSD 8.0、Mac OS X 10.6.8 和 Solaris 10 对 管道 也 定义 了 文件 长 度 ， 它 表示 可 从 该 管道 中 
读 到 的 字 节 数 ， 我 们 将 在 05.2 中 讨论 管道 。 


对 于 普通 文件 ， 其 文件 长 度 可 以 是 0， 在 开始 读 这 种 文件 时 ， 将 得 到 文件 结束 Cend-of-file) 指示 。 
对 于 目录 ， 文 件 长 度 通常 是 一 个 数 (如 16 8$ 5120. 的 整 倍数 ， 我 们 将 在 4.22 节 中 说 明 读 目 录 操 作 。 

对 于 符号 链接 ， 文 件 长 度 是 在 文件 名 中 的 实际 字 节 数 。 例 如 ， 在 下 面 的 例子 中 ， 文 件 长 度 7 
就 是 路 径 名 usr/lib 的 长 度 : 


lrwxrwxrwx 1 root 7 Sep 25 07:14 lib -> usr/lib 


(注意 ， 因 为 符号 链接 文件 长 度 总 是 由 st_size 指示 ， 所 以 它 并 不 包含 通常 C 语言 用 作 名 字 结 尾 
的 null 字 节 。) 

现今 ， 大 多 数 现代 的 UNIX 系统 提供 字段 st_blksize 和 st_blocks。 其 中 ， 第 一 个 是 对 
文件 VO 较 合 适 的 块 长 度 ， 第 二 个 是 所 分 配 的 实际 512 字 节 块 块 数 。 回 忆 3.9 节 ， 其 中 提 到 了 当 
我 们 将 st_blksize 用 于 读 操 作 时 ， 读 一 个 文件 所 需 的 时 间 量 最 少 。 为 了 提高 效率 ， 标 准 UO BE 
(我 们 将 在 第 5 章 中 说 明 ) 也 试图 一 次 读 、 写 st_blksize 个 字 节 。 


应 当 了 解 的 是 ， 不 同 的 UNIX 版 本 其 st blocks 所 用 的 单位 可 能 不 是 512 字 节 的 块 。 使 用 
此 值 并 不 是 可 移植 的 。 


文件 中 的 空洞 


在 3.6 节 中 ， 我 们 提 及 普通 文件 可 以 包含 空洞 。 在 图 3-2 程序 中 例 示 了 这 一 点 。 空 洞 是 由 所 
设置 的 偏 移 量 超过 文件 尾 端 ， 并 写 入 了 某 些 数据 后 造成 的 。 作 为 一 个 例子 ， 考 虑 下 列 情 况 ， 


$ ls -l core 


-rw-r--r-- 1 sar 8483248 Nov 18 12:18 core 
$ du -s core 
212 core 


文件 core 的 长 度 稍稍 超过 8 MB， 可 是 du 命令 报告 该 文件 所 使 用 的 磁盘 空间 总 量 是 272 个 512 
字 节 块 ( 即 139264 字 节 )。 很 明显 ， 此 文件 中 有 很 多 空 润 。 


在 很 多 BSD 类 系统 上 ，du 命令 报告 的 是 1024 字 节 块 的 块 数 ，Solaris 报告 的 是 512 字 节 块 的 

Ak. A Linux b, 报告 的 块 数 单位 取决 于 是 否 设 置 了 环境 变量 POSIXLY_CORRECT。 当 设置 了 

”该 环境 变量 ，du 命令 报告 的 是 1 024 字 节 块 的 块 数 ; 没有 设置 该 环境 变量 时 ，du 命令 报告 的 是 
512 $5653 4t, 
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正如 我 们 在 3.6 节 中 提 及 的 ， 对 于 没有 写 过 的 字 节 位 置 ，read 函数 读 到 的 字 节 是 0。 如 果 执 
行 下 面 的 命令 ， 可 以 看 出 正常 的 UO 操作 读 整 个 文件 长 度 : 


$ wc -c core 
8483248 core 


带 -c 选项 的 wc(1) 命 令 计算 文件 中 的 字符 数 ( 字 节 )。 
如 果 使 用 实用 程序 (如 cat(1)) 复制 这 个 文件 ， 那 么 所 有 这 些 空洞 都 会 被 填 满 ， 其 中 所 有 实 
际 数据 字 节 皆 填 写 为 0。 


$ cat core > core.copy 
$ ls -1 core* 


-rw-r--r-- ] sar 8483248 Nov 18 12:18 core 
-rw-rw-r-- ] sar 8483248 Nov 18 12:27 core.copy 
$ du -s core* 

272 core 


16592  core.copy 


从 中 可 见 ， 新 文件 所 用 的 实际 字 节 数 是 8 495 104 (512x16 592)。 此 长 度 与 1s 命令 报告 的 长 度 不 
同 ， 其 原因 是 ， 文 件 系 统 使 用 了 若干 块 以 存放 指向 实际 数据 块 的 各 个 指针 。 

有 兴趣 的 读者 可 以 参阅 Bach[1986] 的 4.2 节 、McKusick 等 [1996] 的 7.2 节 和 7.3 节 (ER McKusick 
和 Neville-Neil[2005] 的 8.2 节 和 各 8.3 节 )、McDougall 和 Mauro[2007]ff] 15.2 节 以 及 Singh[2006] 的 
第 12 章 ， 以 更 详细 地 了 解 文件 的 物理 结构 。 


4.13 文件 截断 


有 时 我 们 需要 在 文件 尾 端 处 截 去 一 些 数据 以 缩短 文件 。 将 一 个 文件 的 长 度 截断 为 0 是 一 个 特 
例 ， 在 打开 文件 时 使 用 0. TRUNC 标志 可 以 做 到 这 一 点 。 为 了 截断 文件 可 以 调用 函数 truncate 
和 ftruncate。 


#finclude <unistd.h> 


int truncate(const char *pathname, off t length): 


int ftruncate(int /d, off t length); 





这 两 个 函数 将 一 个 现 有 文件 长 度 截断 为 length。 如 果 该 文件 以 前 的 长 度 大 于 length, WEE 
length 以 外 的 数据 就 不 再 能 访问 。 如 果 以 前 的 长 度 小 于 length， 文 件 长 度 将 增加 ， 在 以 前 的 文件 
尾 端 和 新 的 文件 尾 端 之 间 的 数据 将 读 作 0〈 也 就 是 可 能 在 文件 中 创建 了 一 个 空洞 )。 


早 于 4.4BSD 的 BSD 系统 只 能 用 truncate 函数 截 短 一 个 文件 ， 不 能 用 它 扩 展 一 个 文件 。 
Solaris 对 fentl 函数 进行 了 扩展 ,增加 了 F FREESP, 它 允 许 释放 一 个 文件 中 的 任何 一 部 分 ， 
不 只 是 文件 尾 端 处 的 一 部 分 。 


图 13-6 的 程序 使 用 了 ftruncate 函数 ， 以 便 在 获得 对 一 个 文件 的 锁 后 ， 清 空 该 文件 。 


4.14 ”文件 系统 
为 了 说 明文 件 链接 的 概念 ， 先 要 介绍 UNIX 文件 系统 的 基本 结构 。 同 时 ， 了 解 i 节点 和 指向 
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i 节点 的 目录 项 之 间 的 区 别 也 是 很 有 益 的 。 

目前 ， 正 在 使 用 的 UNIX 文件 系统 有 多 种 实现 。 例 如 ，Solaris 支持 多 种 不 同类 型 的 磁盘 文件 
RA: 传统 的 基于 BSD 的 UNIX 文件 系统 〔( 称 为 UFS)， 读 、 写 DOS 格式 软盘 的 文件 系统 ORK 
为 PCFS)， 以 及 读 CD 的 文件 系统 〈 称 为 HSFS)。 在 图 2-20 中 ， 我 们 已 经 看 到 了 不 同类 型 文件 
系统 的 一 个 区 别 。UFS 是 以 Berkeley 快速 文件 系统 为 基础 的 。 本 节 讨 论 该 文件 系统 。 


每 一 种 文件 系统 类 型 都 有 它 各 自 的 特征 ， 有 些 特征 可 能 是 混淆 不 清 的 。 例如， 大 部 分 UNIX 
文件 系统 支持 大 小 写 教 感 的 文件 名 。 因 此 ， 如 果 创 建 了 一 个 名 为 file.txt 的 文件 以 及 另外 一 
个 名 为 file.FXT 的 文件 ， 就 是 创建 了 两 个 不 同 的 文件 。 在 Mac OS X E, HES 文件 系统 是 大 
小写 保留 的 ， 并 且 是 大 小 写 不 敏感 比较 的 。 因 此 ， 如 果 创 建 了 一 个 名 为 file.txt 的 文件 ， 当 
.你 再 创建 名 为 file. TXT 的 文件 时 ,就 会 履 盖 原来 的 file.txt 文件 。 但 是 , 保存 在 文件 系统 
”中 的 是 文件 创建 时 的 文件 名 ( 即 file .txt， 因 为 是 大 小 写 保留 的 )。 事 实 上 , & "t, i, 1, 
(e, ., t, x, t” 这 个 序列 中 的 大 写 或 小 写字 母 的 排列 都 会 在 搜索 这 个 文件 时 得 到 匹配 ( 大 小 
: ERKKI) Boh, RT file.txt 和 file.TXT, 我 们 还 可 以 用 File.txt. fILE.tXt 
; 以 及 FiLe.TxT 等 名 字 来 访问 该 文件 。 


我 们 可 以 把 一 个 磁盘 分 成 一 个 或 多 个 分 区 。 每 个 分 区 可 以 包含 一 个 文件 系统 CL 4-13). i 
节点 是 固定 长 度 的 记录 项 ， 它 包含 有 关 文 件 的 大 部 分 信息 。 





~ 
~ 


图 4-13 ”磁盘 、 分 区 和 文件 系统 


如 果 更 仔细 地 观察 一 个 柱 面 组 的 i 节点 和 数据 块 部 分 ， 则 可 以 看 到 图 4-14 中 所 示 的 情况 。 

注意 图 4-14 中 的 下 列 各 点 。 

e 在 图 中 有 两 个 目录 项 指向 同一 个 i 节点 。 每 个 i 节点 中 都 有 一 个 链接 计数 ， 其 值 是 指向 该 
i 节 点 的 目录 项 数 。 只 有 当 链 接 计数 减少 至 0 时 ， 才 可 删除 该 文件 (也 就 是 可 以 释放 该 文 
件 占 用 的 数据 块 )。 这 就 是 为 什么 “解除 对 一 个 文件 的 链接 ”操作 并 不 总 是 意味 着 “释放 
该 文件 占用 的 磁盘 块 ” 的 原因 。 这 也 是 为 什么 删除 一 个 目录 项 的 函数 被 称 之 为 unlink 
而 不 是 delete 的 原因 。 在 stat 结构 中 ， 链 接 计 数 包 含 在 st_nlink 成 员 中 ， 其 基本 
系统 数据 类 型 是 nlink_t。 这 种 链接 类 型 称 为 硬 链 接 。 回 忆 2.5.2 节 ， 其 中 ，POSIX.1 95 
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量 LINK_MAX 指定 了 一 个 文件 链接 数 的 最 大 值 。 
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图 4-14 较 详 细 的 柱 面 组 的 i 节点 和 数据 块 
e 另外 一 种 链接 类 型 称 为 符号 链接 (symbolic link)。 符 号 链接 文件 的 实际 内 容 〈 在 数据 块 
H) 包含 了 该 符号 链接 所 指向 的 文件 的 名 字 。 在 下 面 的 例子 中 ， 目 录 项 中 的 文件 名 是 3 
个 字符 的 字符 串 1ib， 而 在 该 文件 中 包含 了 7 个 字 节 的 数据 usr/lib: 


lrwxrwxrwx 1 root 7 Sep 25 07:14 lib -> urs/lib 


该 i 节点 中 的 文件 类 型 是 S_IFLNK， 于 是 系统 知道 这 是 一 个 符号 链接 。 

e i 节点 包含 了 文件 有 关 的 所 有 信息 ， 文件 类 型 、 文 件 访 问 权 限 位 、 文 件 长 度 和 指向 文件 数 
据 块 的 指针 等 。stat 结构 中 的 大 多 数 信息 都 取 自 i 节点 。 只 有 两 项 重要 数据 存放 在 目录 
项 中 : 文件 名 和 i 节点 编号 。 其 他 的 数据 项 (如 文件 名 长 度 和 目录 记录 长 度 ) 并 不 是 本 书 

L4 关心 的 。i 节点 编号 的 数据 类 型 是 ino t. 

。 因为 目录 项 中 的 i 节点 编号 指向 同一 文件 系统 中 的 相应 i 节点 ， 一 个 目录 项 不 能 指向 另 一 
个 文件 系统 的 i 节点。 这 就 是 为 什么 1n(1) 命 令 (构造 一 个 指向 一 个 现 有 文件 的 新 目录 项 ) 
不 能 跨越 文件 系统 的 原因 。 我 们 将 在 下 一 节 说 明 link 函数 。 

e 当 在 不 更 换文 件 系 统 的 情况 下 为 一 个 文件 重 命名 时 ， 该 文件 的 实际 内 容 并 未 移动 ， 只 需 
构造 一 个 指向 现 有 i 节 点 的 新 目录 项 ， 并 删除 老 的 目录 项 。 链 接 计 数 不 会 改变 。 例 如 ， 为 
将 文件 /usr/1ib/foo 重 命名 为 /usr/foo,; 如 果 目 录 /usr/1ib 和 /usr 在 同一 文件 系 
统 中 ， 则 文件 foo 的 内 容 无 需 移动 。 这 就 是 mv(T) 命 令 的 通常 操作 方式 。 

我 们 说 明了 普通 文件 的 链接 计数 概念 ， 但 是 对 于 目录 文件 的 链接 计数 字段 义 如 何 呢 ?假定 我 

们 在 工作 目录 中 构造 了 一 个 新 目录 : 


$ mkdir testdir 


图 4-15 显示 了 其 结果 。 注 意 ， 该 图 显 式 地 显示 了 .和 . . 目录 项 。 
编号 为 2549 的 i 节点， 其 类 型 字段 表示 它 是 一 个 目录 ， 链 接 计 数 为 2。 任何 一 个 叶 目 录 CR 
包含 任何 其 他 目录 的 目录 ) 的 链接 计数 总 是 2， 数 值 2 来 自 于 命名 该 目录 (testdir) 的 目录 项 
以 及 在 该 目录 中 的 .项 。 编 号 为 1267 的 i 节点 ， 其 类 型 字段 表示 它 是 一 个 目录 ， 链 接 计 数 大 于 或 
等 于 3。 它 大 于 或 等 于 3 的 原因 是 ,至 少 有 3 个 目录 项 指向 它 : 一 个 是 命名 它 的 目录 项 (在 图 4-15 
中 没有 表示 出 来 ), 第 二 个 是 在 该 目录 中 的 .项 , 第 三 个 是 在 其 子 目录 testdir 中 的 . .项 。 注 意 ， 

在 父 目 录 中 的 每 一 个 子 目录 都 使 该 父 目录 的 链接 计数 增加 1。 


4.15 pha link. linkat, unlink, unlinkat Ml remove 93 








目录 块 和 数据 块 





1 
! 1 
t 1 


Ce 
8. 
2549 | testair | 
4-15 ”创建 了 目录 testdir 后 的 文件 系统 实例 


这 种 格式 与 UNIX 文件 系统 的 经 典 格式 类 似 ， 在 Bach[1986] 的 第 4 章 中 对 此 进行 了 详细 说 明 。 关 于 
伯克利 快速 文件 系统 对 此 所 做 的 更 改 请 参阅 McKusick 等 [1996] 的 第 7 章 以 及 McKusick 和 
Neville-Neil[2005] 中 的 第 8 章 。 关 于 UFS( 伯 克利 快速 文件 系统 的 Solaris 版 ) 的 详细 情况 ,请 参见 McDougall 
和 Mauro[2007] 的 第 15 章 。 关 于 Mac OS X 使 用 的 HEF'S 文件 系统 格式 ， 请 参阅 Singh[2006] 的 第 12 S. 


4.15 PRM link, linkat, unlink, unlinkat 和 remove 


如 上 节 所 述 ， 任 何 一 个 文件 可 以 有 多 个 目录 项 指向 其 i 节点 。 创 建 一 个 指向 现 有 文件 的 链接 
的 方法 是 使 用 link 函数 或 Linkat 函数 。 
#include <unistd.h> 


int link(const char *existingpath, const char *newpath) ; 


int linkat(int efd, const char *existingpath, int nfd, const char *newpath, int flag); 
两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1! 





这 两 个 函数 创建 一 个 新 目录 项 newpath， 它 引用 现 有 文件 existingpath. WR newpath 已 经 存 
在 ， 则 返回 出 错 。 只 创建 newpath 中 的 最 后 一 个 分 量 ， 路 径 中 的 其 他 部 分 应 当 已 经 存在 。 

对 于 linkat 函数 ， 现 有 文件 是 通过 efd 和 existinepath 参数 指定 的 ， 新 的 路 径 名 是 通过 nfd 
和 newpath 参数 指定 的 。 默 认 情 况 下 ， 如 果 两 个 路 径 名 中 的 任 一 个 是 相对 路 径 ， 那 么 它 希 要 通过 
相对 于 对 应 的 文件 描述 符 进 行 计算 。 如 果 两 个 文件 描述 符 中 的 任 一 个 设置 为 AT_FDCWD， 那 么 相 
应 的 路 径 名 (如 果 它 是 相对 路 径 ) 就 通过 相对 于 当前 目录 进行 计算 。 如 果 任 一 路 径 名 是 绝对 路 径 ， 
相应 的 文件 描述 符 参 数 就 会 被 忽略 。 

当 现 有 文件 是 符号 链接 时 ， 由 flag 参数 来 控制 inkat 函数 是 创建 指向 现 有 符号 链接 的 链接 还 
是 创建 指向 现 有 符号 链接 所 指向 的 文件 的 链接 .。 RE flag 参数 中 设置 了 AT SYMLINK FOLLOW 标 
志 ， 就 创建 指向 符号 链接 目标 的 链接 。 如 果 这 个 标志 被 清除 了 ， 则 创建 一 个 指向 符号 链接 本 身 的 链接 。 

创建 新 目录 项 和 增加 链接 计数 应 当 是 一 个 原子 操作 (请 回忆 在 3.11 节 中 对 原子 操作 的 讨论 )。 
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虽然 POSIX.1 允许 实现 支持 跨越 文件 系统 的 链接 , 但 是 大 多 数 实现 要 求 现 有 的 和 新 建 的 两 个 
路 径 名 在 同一 个 文件 系统 中 。 如 果实 现 支持 创建 指 癌 一 个 目录 的 硬 链 接 ， 那 么 也 仅 限 于 超级 用 户 
才 可 以 这 样 做 。 其 理由 是 这 样 做 可 能 在 文件 系统 中 形成 循环 ， 大 多 数 处 理 文件 系统 的 实用 程序 都 
不 能 处 理 这 种 情况 〈4.17 节 将 说 明 一 个 由 符号 链接 引入 循环 的 例子 )。 因 此 ， 很 多 文件 系统 实现 
不 允许 对 于 目录 的 硬 链接 。 

为 了 删除 一 个 现 有 的 目录 项 ， 可 以 调用 unlink 函数 。 


#include <unistd.h> 


int unlink(const char *pathname) ; 


int unlinkat(int fd, const char *pathname, int flag); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 





这 两 个 函数 删除 目录 项 ， 并 将 由 pathname 所 引用 文件 的 链接 计数 减 1。 如 果 对 该 文件 还 有 其 
他 链接 ， 则 仍 可 通过 其 他 链接 访问 该 文件 的 数据 。 如 果 出 错 ， 则 不 对 该 文件 做 任何 更 改 。 

我 们 在 前 面 已 经 提 及 ， 为 了 解除 对 文件 的 链接 ， 必 须 对 包含 该 目录 项 的 目录 具有 写 和 执行 权限 。 正 
如 4.10 节 所 述 , 如 果 对 该 目录 设置 了 粘着 位 ， 则 对 该 目录 必须 具有 写 权 限 , 并 且 具 备 下 面 三 个 条 件 之 一 : 

© 拥有 该 文件 ; 

。 拥有 该 目录 ; 

。 具有 超级 用 户 权 限 。 

只 有 当 链 接 计数 达到 0 时 ， 该 文件 的 内 容 才 可 被 删除 。 另 一 个 条 件 也 会 阻止 删除 文件 的 内 
容 一 一 只 要 有 进程 打开 了 该 文件 ， 其 内 容 也 不 能 删除 。 关 闭 一 个 文件 时 ， 内 核 首 先 检 查 打 开 该 
文件 的 进程 个 数 ， 如果 这 个 计数 达到 0， 内 核 再 去 检查 其 链接 计数 ;如 果 计 数 也 是 0， 那么 就 删 
除 该 文件 的 内 容 。 

如 果 pathname 参数 是 相对 路 径 名 ， 那 么 unlinkat 函数 计算 相对 于 由 应 文件 描述 符 参 数 代 
表 的 目录 的 路 径 名 。 如 果 应 参数 设置 为 AT_FDCWD， 那 么 通过 相对 于 调用 进程 的 当前 工作 目录 来 
计算 路 径 名 。 如 果 pathname 参数 是 绝对 路 径 名 ， 那 么 fa S SOR NR. 

flag 参数 给 出 了 一 种 方法 , 使 调用 进程 可 以 改变 unlinkat 函数 的 默认 行为 。 当 AT_REMOVEDIR 
标志 被 设置 时 ，unlinkat 函数 可 以 类 似 于 rmdir 一 样 删除 目录 。 如 果 这 个 标志 被 清除 ， 
unlinkat 与 unlink 执行 同样 的 操作 。 


实例 


图 4-16 的 程序 打开 一 个 文件 ， 然 后 解除 它 的 链接 。 执 行 该 程序 的 进程 然后 睡眠 15 秒 ， 接 着 
就 终止 。 


#include "apue.h" 
#include «fcntl.h» 





int 
main(void) 
1 
if (open("tempfile", O_RDWR) < 0) 
err sys("open error"); 
if (unlink("tempfile") < 0) 
err sys("unlink error"); 
printf ("file unlinkedMn"); 
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Sleep(15); 
printf("doneMn"); 
exit (0); 


图 4-16 ”打开 一 个 文件 ， 然 后 unlink € 
运行 该 程序 ， 其 结果 是 ; 


$ ls -l tempfile 查看 文件 大 小 

-rw-r----- ] sar 413265408 Jan 21 07:14 tempfile 

$ df /home 检查 可 用 磁盘 空间 

Filesystem 1kK-blocks Used Available Use% Mounted on 

/dev/hda4 11021440 1956332 9065108 18% /home 

$ ./a.out & 在 后 台 运 行 图 4-16 程序 

1364 shell 打印 其 进程 ID 

$ file unlinked 解除 文件 链接 

1s -1 tempfile 观察 文件 是 否 仍然 存在 

ls: tempfile: No such file or directory 目录 项 已 删除 

$ df /home 检查 可 用 磁盘 空间 有 无 变化 

Filesystem 1lK-blocks Used Available Use$ Mounted on 

/dev /hda4 11021440 1956332 9065108 18% /home 

$ done 程序 执行 结束 ， 关 闭 所 有 打开 文件 

df /home 现在 ， 应 当 有 更 多 可 用 磁盘 空间 

Filesystem 1K-blocks Used Available Use% Mounted on 

/dev /hda4 11021440 1552352 9469088 15% /home i 
现在 ，394.1 MB 磁盘 空间 可 用 国 


unlink 的 这 种 特性 经 常 被 程序 用 来 确保 即使 是 在 程序 骨 江 时 ， 它 所 创建 的 临时 文件 也 不 会 遗 
留 下 来 。 进程 用 open 或 creat 创建 一 个 文件 ， 然 后 立即 调用 unlink， 因 为 该 文件 仍旧 是 打开 
的 ， 所 以 不 会 将 其 内 容 删 除 。 只 有 当 进 程 关 闭 该 文件 或 终止 时 【在 这 种 情况 下 ， 内 核 关 闭 该 进程 
所 打开 的 全 部 文件 )， 该 文件 的 内 容 才 被 删除 。 

如 果 pathname 是 符号 链接 , 那么 unlink 删除 该 符号 链接 , 而 不 是 删除 由 该 链接 所 引用 的 文件 。 
给 出 符号 链接 名 的 情况 下 ， 没 有 一 个 函数 能 删除 由 该 链接 所 引用 的 文件 。 

如 果 文 件 系统 支持 的 话 ， 超 级 用 户 可 以 调用 unlink, HER pathname 指定 一 个 目录 ， 
但 是 通常 应 当 使 用 rmdir AM, 而 不 使 用 unlink 这 种 方式 。 我 们 将 在 4.21 节 中 说 明 rmdir 
函数 。 

我 们 也 可 以 用 remove 函数 解除 对 一 个 文件 或 目录 的 链接 。 对 于 文件 ，remove 的 功能 与 
unlink 相同 。 对 于 目录 ，remove 的 功能 与 rmdir 相同 。 


$include <stdio.h> 





int remove(const char *pathname) ; 





返回 值 ， 车 成 功 ， 返 回 HS, RE-I 
ISO C 指定 remove 函数 删除 一 个 文 忻 ,这 和 更改 了 UNIX 历来 使 用 的 名 字 unlink, 其 原因 是 实 
现 C 标准 的 大 多 数 非 UNIX 系统 并 不 支持 文件 链接 。 


4.16 函数 rename 和 renameat 


文件 或 目录 可 以 用 rename 函数 或 者 renameat 函数 进行 重 命名 。 
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#include <stdio.h> 


int rename (const char *oldname, const char *newname); 


int renameat(int oldfd, const char *oldname, int mewfd, const char *newname); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 





ISOC 对 文件 定义 了 rename 函数 (CC 标准 不 处 理 目 录 )。POSIX.1 扩展 此 定义 ,使 其 包含 了 
“目录 和 符号 链接 。 


根据 oldname 是 指 文件 、 目 录 还 是 符号 链接 ， 有 几 种 情况 需要 加 以 说 明 。 我 们 也 必须 说 明 如 
R newname 已 经 存在 时 将 会 发 生 什 么 。 

(1) 如 果 oldname 指 的 是 一 个 文件 而 不 是 目录 ， 那 么 为 该 文件 或 符号 链接 重 命 名 。 在 这 种 情 
况 下 ， 如 果 newname 已 存在 ， 则 它 不 能 引用 一 个 目录 。 如 果 newname 已 存在 ， 而 且 不 是 一 个 目 
录 ， 则 先 将 该 目录 项 删除 然后 将 oldname 重 命名 为 newname。 对 包含 oldname 的 目录 以 及 包含 
newname 的 目录 ， 调 用 进程 必须 具有 写 权 限 ， 因 为 将 更 改 这 两 个 目录 。 

(2) 如 若 oldname 指 的 是 一 个 目录 ， 那 么 为 该 目录 重 命名 。 如 果 newname 已 存在 ， 则 它 必 须 
引用 一 个 目录 ， 而 且 该 目录 应 当 是 空 目录 〈 空 目录 指 的 是 该 目录 中 只 有 .和 . .项 )。 如 果 newname 
存在 《而 且 是 一 个 空 目 录 )， 则 先 将 其 删除 ， 然 后 将 oldname 重 命名 为 newname。 男 外 ， 当 为 一 
个 目录 重 命名 时 ，newname 不 能 包含 oldname 作为 其 路 径 前 缀 。 例 如 ， 不 能 将 /usr/ftoo EmA 

为 /usr/foo/testdir， 因 为 旧名 字 (/usr/foo) 是 新 名 字 的 路 径 前 级 ， 因 而 不 能 将 其 删除 。 

(3) WË oldname 或 newname 引用 符号 链接 ， 则 处 理 的 是 符号 链接 本 身 ， 而 不 是 它 所 引用 的 
文件 。 

(4) 不 能 对 .和 . . 重 命 名 。 更 确切 地 说 ，. 和 . .都 不 能 出 现在 oldname 和 newname 的 最 后 部 分 。 

C5) 作为 一 个 特例 ， 如 果 oldname 和 newname 引用 同一 文件 ， 则 函数 不 做 任何 更 改 而 成 功 返 回 。 

如 若 newname 已 经 存在 ， 则 调用 进程 对 它 需 要 有 写 权 限 〈 如 同 删除 情况 一 样 )。 另 外 ， 调 用 
进程 将 删除 oldname 目录 项 ， 并 可 能 要 创建 newname 目录 项 ， 所 以 它 需 要 对 包含 oldname 及 包含 
newname 的 目录 具有 写 和 执行 权限 。 

除了 当 oldname 或 newname 指向 相对 路 径 名 时 ， 其 他 情况 下 renameat 函数 与 rename FR 
数 功 能 相同 。 如果 oldname 参数 指定 了 相对 路 径 , 就 相对 于 oldfd 参数 引用 的 目录 来 计算 oldname. 
类 似 地 ， 如 果 newname 指定 了 相对 路 径 ， 就 相对 于 newfad 引用 的 目录 来 计算 newname. oldfd 或 
newfd 参数 (或 两 者 ) 都 能 设置 成 AT_FDCWD， 此 时 相对 于 当前 目录 来 计算 相应 的 路 径 名 。 


4.17 ”符号 链接 


符号 链接 是 对 一 个 文件 的 间接 指针 ， 它 与 上 一 节 所 述 的 硬 链接 有 所 不 同 ， 硬 链接 直接 指向 文 
件 的 i 节点 。 引 入 符号 链接 的 原因 是 为 了 避 开 硬 链 接 的 一 些 限制 。 

。 硬 链接 通常 要 求 链接 和 文件 位 于 同一 文件 系统 中 。 

。 只 有 超级 用 户 才 能 创建 指向 目录 的 硬 链接 〈 在 底层 文件 系统 支持 的 情况 下 )。 

对 符号 链接 以 及 它 指 向 何 种 对 象 并 无 任何 文件 系统 限制 ， 任 何 用户 都 可 以 创建 指向 目录 的 符 
号 链接 。 符 号 链接 一 般 用 于 将 一 个 文件 或 整个 目录 结构 移 到 系统 中 另 一 个 位 置 。 

当 使 用 以 名 字 引 用 文件 的 函数 时 ， 应 当 了 解 该 函数 是 否 处 理 符号 链接 。 也 就 是 该 函数 是 否 跟 
随 符号 链接 到 达 它 所 链接 的 文件 。 如 若 该 函数 具有 处 理 符号 链接 的 功能 ， 则 其 路 径 名 参数 引用 由 
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符号 链接 指向 的 文件 。 否则, 一 个 路 径 名 参数 引用 链接 本 身 , 而 不 是 由 该 链接 指向 的 文件 。 图 4-17 
列 出 了 本 章 中 所 说 明 的 各 个 函数 是 省 处 理 符号 链接 。 在 图 4-17 中 没有 列 出 mkdir. mkinfo. 
mknod 和 rmdir 这 些 函 数 ， 其 原因 是 ， 当 路 径 名 是 符号 链接 时 ， 它 们 都 出 错 返 回 。 以 文件 描述 
符 作 为 参数 的 一 些 范 数 (如 fstat、fchmod 等 ) 也 未 在 该 图 中 列 出 ， 其 原因 是 ， 对 符号 链接 的 
处 理 是 由 返回 文件 描述 符 的 函数 (通常 是 open) 进行 的 。chown 是 否 跟随 符号 链接 取决 于 实现 。 
在 所 有 现代 的 系统 中 ，chown 函数 都 跟随 符号 链接 。 
符号 链接 由 4.2BSD 引入 ，chown 最 初 并 不 跟随 符号 链接 ， 但 在 4.4BSD 中 情况 发 生 了 变化 。 
| SVR4 中 的 System V 包含 了 对 符号 链接 的 支持 ， 但 与 原始 BSD 中 的 行为 已 大 不 相同 ， 也 实现 了 
: chown 函数 跟随 符号 链接 。 早 期 Linux 版 本 中 (Linux 2.1.81 以 前 的 版 本 )，chown 并 不 跟随 符号 
链接。 从 2.1.81 版 开始 ，chown 跟随 符号 链接 。FreeBSD 8.0, Mac OS X 10.6.8 和 Solaris 10 P, 
, chown 跟随 符号 链接 。 所 有 这 些 平 台 都 实现 了 1chown， 它 改变 符号 链接 自身 的 所 有 权 。 


access 
chdir 
chmod 
chown 
creat 
exec 
lchown 
link 
lstat 
open 
opendir 
pathconf 
readlink 
remove 
rename 
stat 
truncate 
unlink 


图 4-17 BPRS SERES AEE 


4-17 的 一 个 例外 是 ， 同 时 用 O CREAT 和 O_EXCL 两 者 调用 open 函数 。 在 此 情况 下 ， 若 
路 径 名 引用 符号 链接 ，open 将 出 错 返 回 ，errno 设置 为 BEXIST。 这 种 处 理 方 式 的 意图 是 堵塞 
一 个 安全 性 漏洞， 以 防止 具有 特权 的 进程 被 诱骗 写 错误 的 文件 。 


实例 


使 用 符号 链接 可 能 在 文件 系统 中 引入 循环 。 大 多 数 查 找 路 径 名 的 函数 在 这 种 情况 发 生 时 都 将 
出 错 返 回 ，errno 值 为 ELOOP。 考 虑 下 列 命令 序列 ， 





$ mkdir foo 创建 一 个 新 目录 

$ touch foo/a 创建 一 个 0 长度 的 文件 
$ ln -s ../foo foo/testdir 创建 一 个 符号 链接 

$ is -1 foo 

total 0 

-rw-r----- 1 sar 0 Jan 22 00:16 a 


lrwxrwxrwx 1 sar 6 Jan 22 00:16 testdir -> ../foo 
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这 创建 了 一 个 目录 foo， 它 包含 了 一 个 名 为 a 的 文件 以 及 一 个 指向 foo 的 符号 链接 。 在 图 4-18 
中 显示 了 这 种 结果 ， 图 中 以 圆 表示 目录 ， 以 正方 形 表示 
一 个 文件 。 

如 果 我 们 写 一 段 简单 的 程序 ， 使 用 Solaris 的 标准 函 
数 ftw(3) 以 降序 遍历 文件 结构 , 打印 每 个 遇 到 的 路 径 名 ， 
则 其 输出 是 : 


foo 


foo/a 4-18 构成 循环 的 符号 链接 testdir 


foo/testdir 

foo/testdir/a 
foo/testdir/testdir 
foo/testdir/testdir/a 
foo/testdir/testdir/testdir 
foo/testdir/testdir/testdir/a 


(SST, BS ftw 出 错 返 回 ， 此 时 ，errno 值 为 ELOOP) 
422 节 提 供 了 我 们 自己 的 ftw RARE, CH 1stat 代替 stat 以 阻止 它 跟 随 符号 链接 。 


| BË, Linux 的 ftw 和 nftw 函数 记录 了 所 有 看 到 的 目录 并 避免 多 次 重复 处 理 一 个 目录 ， 因 
| 此 这 两 个 函数 不 显示 这 种 程序 运行 行为 。 


这 样 一 个 循环 是 很 容易 消除 的 。 因 为 unlink 并 不 跟随 符号 链接 ， 所 以 可 以 unlink 文件 
foo/testdir。 但 是 如 果 创 建 了 一 个 构成 这 种 循环 的 硬 链 接 ， 那 么 就 很 难 消除 它 。 这 就 是 为 什 
A link 函数 不 允许 构造 指向 目录 的 硬 链接 的 原因 〈 除 非 进程 具有 超级 用 户 权限 )。 


实际 上 ，Rich Stevens 在 写本 节 的 最 初版 本 时 ， 在 自己 的 系统 上 做 了 一 个 这 样 的 实验 。 结 果 文 
件 系统 变 得 错误 百出 。 正 常 的 fsck(1) 实 用 程序 不 能 修复 问题 。 为 了 修复 文件 系统 ， 不 得 不 使 用 
， 了 并 不 推荐 使 用 的 工具 clri(8) 和 dcheck(8)。 
: 对 目录 的 硬 链接 的 需求 由 来 已 久 ， 但 是 使 用 符号 链接 和 mkdir 函数 ， 用 户 就 不 再 需要 创建 指 
”向 目录 的 硬 链接 了 。 


用 open 打开 文件 时 ， 如 果 传 递 给 open 函数 的 路 径 名 指定 了 一 个 符号 链接 ， 那 么 open 跟 
随 此 链接 到 达 所 指定 的 文件 。 若 此 符号 链接 所 指向 的 文件 并 不 存在 ， 则 open 返回 出 错 ， 表 示 它 
不 能 打开 该 文件 。 这 可 能 会 使 不 熟悉 符号 链接 的 用 户 感到 迷惑 ， 例 如 ， 





$ ln -s /no/such/file myfile 创建 一 个 符号 链接 

$ 1s myfile 

myfile ls 查 到 该 文件 

$ cat myfile 试图 查看 该 文件 

cat: myfile: No such file or directory 

$ 1s -1 myfile 尝试 -1 选项 

lrwxrwxrwx 1 sar 13 Jan 22 00:26 myfile -» /no/such/file 


文件 myfile FE., W cat 却 称 没 有 这 一 文件 。 其 原因 是 myfile 是 个 符号 链接 ， 由 该 符 
号 链接 所 指向 的 文件 并 不 存在 。1s 命令 的 -1 选项 给 我 们 两 个 提示 : 第 一 个 字符 是 1， 它 表示 这 
是 一 个 符号 链接 ， 而 -> 也 表明 这 是 一 个 符号 链接 。1s 命令 还 有 另 一 个 选项 -F， 它 会 在 符号 链接 
的 文件 各 后 加 一 个 8 符号 ， 在 未 使 用 -1 选项 时 ， 这 可 以 帮助 我 们 识别 出 符号 链接 。 " 
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4.18 ”创建 和 读 取 符号 链接 
可 以 用 symlink 或 symlinkat 函数 创建 一 个 符号 链接 。 






#include <unistd.h> 






int symlink(const char *actualpath, const char *sympath); 
int symlinkat(const char *actualpath, int fd, const char *sympath); 
两 个 函数 的 返回 值 : FRH, RE 0， 若 出 错 ， 返 回 -1 

函数 创建 了 一 个 指向 actualpath 的 新 目录 项 sympath。 在 创建 此 符号 链接 时 ， 并 不 要 求 actualpath 
已 经 存在 (在 上 一 节 结 束 部 分 的 例子 中 我 们 已 经 看 到 了 这 一 点 )。 并 且 ，actwalpath 和 sympath 并 
不 需要 位 于 同一 文件 系统 中 。 

symlinkat AMS symlink 函数 类 似 , 但 sympath 参数 根据 相对 于 打开 文件 描述 符 引用 的 
目录 (由 fa 参数 指定 ) 进行 计算 。 如 果 sympath 参数 指定 的 是 绝对 路 径 或 者 A 参数 设置 了 
AT_FDCWD 值 ， 那 么 symlinkat 就 等 同 于 symlink BR. 

因为 open 函数 跟随 符号 链接 , 所 以 需要 有 一 种 方法 打开 该 链接 本 身 ， 并 读 该 链接 中 的 名 字 。 
readlink 和 readlinkat 函数 提供 了 这 种 功能 。 


#include <unistd.h> 





ssize t readlink(const char *restrict pathname, char *restrict buf, 
size t bufsize): 


ssize t readlinkat(int fd, const char* restrict pathname, 
char *restrict buf, size t bufsize); 





两 个 函数 组 合 了 open. read 和 close 的 所 有 操作 ‘ieee. 则 返回 读 入 buf 
的 字 节 数 。 在 bf 中 返回 的 符号 链接 的 内 容 不 以 null FHE. 

当 pathname 参数 指定 的 是 绝对 路 径 名 或 者 应 参数 的 值 为 AT_FDCWD，readlinkat 函数 的 
行为 与 readlink 相同 。 但 是 ， 如 果 .大 参数 是 一 个 打开 且 录 的 有 效 文件 描述 符 并 且 pathname 参 
数 是 相对 路 径 名 ， 则 readlinkat 计算 相对 于 由 应 代表 的 打开 目录 的 路 径 名 。 


4.19 ”文件 的 时 间 


在 4.2 节 中 , 我 们 讨论 了 Single UNIX Specification 2008 年 版 如 何 提 高 stat 结构 中 时 间 字 段 
的 精度 , 从 原来 的 秒 提 高 到 秒 加 上 纳 秒 。 每 个 文件 属性 所 保存 的 实际 精度 依赖 于 文件 系统 的 实现 。 
对 于 把 时 间 惟 记录 在 秒 级 的 文件 系统 来 说 ， 纳 秒 这 个 字段 就 会 被 填充 为 0。 对 于 时 间 改 的 记录 精 
度 高 于 秒 级 的 文件 系统 来 说 ， 不 足 秒 的 值 被 转换 成 纳 秒 并 记录 在 纳 秒 这 个 字段 中 。 

对 每 个 文件 维护 3 个 时 间 字 段 ， 它 们 的 意义 示 于 图 4-19 m. 


st. “aca — 文件 数据 的 最 后 访问 时 间 | read | — 
st mtim 文件 数据 的 最 后 修改 时 间 write ER 
st ctim i 节点 状态 的 最 后 更 改 时 间 chmod. chown -c 


图 4-19 与 每 个 文件 相关 的 3 个 时 间 值 
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注意 ， 修 改 时 间 (st_mt im) 和 状态 更 改 时 间 (st_ctim) 之 间 的 区 别 。 修 改 时 间 是 文件 内 容 
最 后 一 次 被 修改 的 时 间 。 状 态 更 改 时 间 是 该 文件 的 i 节点 最 后 一 次 被 修改 的 时 间 。 在 本 章 中 我 们 已 
说 明了 很 多 影响 到 i 节点 的 操作 ， 如 更 改 文 件 的 访问 权限 、 更 改 用 户 ID、 更 改 链接 数 等 ， 但 它们 并 
没有 更 改 文 件 的 实际 内 容 。 因 为 i 节点 中 的 所 有 信息 都 是 与 文件 的 实际 内 容 分 开 存放 的 ， 所 以 ， 除 
了 要 记录 文件 数据 修改 时 间 以 外 ， 还 需要 记录 状态 更 改 时 间 ， 也 就 是 更 改 i 节点 中 信息 的 时 间 。 

注意 ， 系 统 并 不 维护 对 一 个 i 节点 的 最 后 一 次 访问 时 间 ， 所 以 access 和 stat 函数 并 不 更 
改 这 3 个 时 间 中 的 任 一 个 。 

系统 管理 员 常 常 使 用 访问 时 间 来 删除 在 一 定时 间 范 围 内 没有 被 访问 过 的 文件 。 典 型 的 例子 是 删除 在 
过 去 一 周 内 没有 被 访问 过 的 名 为 a .out 或 core 的 文件 。find(1) 命 令 常 被 用 来 进行 这 种 类 型 的 操作 。 

修改 时 间 和 状态 更 改 时 间 可 被 用 来 归档 那些 内 容 已 经 被 修改 或 i 节点 已 经 被 更 改 的 文件 。 

ls 命令 按 这 3 个 时 间 值 中 的 一 个 排序 进行 显示 。 系 统 默 认 〈 用 -1 或 -t 选项 调用 时 ) 是 按 文 件 的 
修改 时 间 的 先后 排序 显示 。-u 选项 使 1s 命令 按 访问 时 间 排 序 ，-c 选项 则 使 其 按 状 态 更 改 时 间 排 序 。 

4-20 列 出 了 我 们 已 说 明 过 的 各 种 函数 对 这 3 个 时 间 的 作用 。 回 忆 4.14 节 中 所 述 ， 目 录 是 
包含 目录 项 (文件 名 和 相关 的 i 节点 编号 ) 的 文件 ， 增 加 、 删 除 或 修改 目录 项 会 影响 到 它 所 在 目 
录 相 关 的 3 个 时 间 。 这 就 是 在 图 4-20 中 包含 两 列 的 原因 ， 其 中 一 列 是 与 该 文件 (或 目录 ) 相关 的 
3 个 时 间 ， 另 一 列 是 与 所 引用 的 文件 (或 目录 〉 的 父 目录 相关 的 3 个 时 间 。 例 如 ， 创 建 一 个 新 文 
件 影响 到 包含 此 新 文件 的 目录 ， 也 影响 该 新 文件 的 i 节点 。 但 是 ， 读 或 写 一 个 文件 只 影响 该 文件 
的 i 节点 ， 而 对 目录 则 无 影响 。 


chmod. fchmod 

chown. fchown 

creat 4 | O CREAT 新 文件 
creat : O TRUNC 现 有 文件 
exec 

lchown . 

link ， 第 二 个 参数 的 父 目 录 
mkdir 

mkfifo 

open : O CREAT 新 文件 
open 3 | o TRUNC 现 有 文件 
pipe 

read 


remove ， 删除 文件 = unlink 
remove ， 删除 目录 = rmdir 
rename , 对 于 两 个 参数 


rmdir 


truncate, ftruncate 
unlink 

utimes. utimensat. 
futimens 

write 





图 4-20 各 种 函数 对 访问 、 修 改 和 状态 更 改 时 间 的 作用 
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(mkdir 和 rmdir 函数 将 在 421 BUB]. utimes. utimensat. futimens MABE 
下 一 节 中 说 明 。7 个 exec 函数 将 在 8.10 节 中 讨论 。 第 15 章 将 说 明 mkfifo M pipe HX.) 


4.20 PAR futimens. utimensat 和 utimes 


一 个 文件 的 访问 和 修改 时 间 可 以 用 以 下 几 个 函数 更 改 。futimens 和 utimensat 函数 可 以 指 
定 纳 秒 级 精度 的 时 间 规 。 用 到 的 数据 结构 是 与 stat 函数 族 相 同 的 timespec 结构 《〈 见 4.2 节 )。 


#include <sys/stat.h> 
int futimens(int fd, const struct timespec limes[2]); 
int utimensat(int/d, const char *path, const struct timespec (imes[2], int flag); 
两 个 函数 返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 

这 两 个 函数 的 times 数组 参数 的 第 一 个 元 素 包含 访问 时 间 ， 第 二 元 素 包 含 修改 时 间 。 这 两 个 
时 间 值 是 日 历时 间 ， 如 1.10 节 所 述 ， 这 是 自 特定 时 间 (1970 年 1 月 1 H 00:00:00) 以 来 所 经 过 的 
秒 数 。 不 足 秒 的 部 分 用 纳 秒表 示 。 

时 间 崔 可 以 按 下 列 4 种 方式 之 一 进行 指定 。 

(1) 如 果 times 参数 是 一 个 空 指 针 ， 则 访问 时 间 和 修改 时 间 两 者 都 设置 为 当前 时 间 。 

(2) WE times 参数 指向 两 个 timespec 结构 的 数组 ， 任 一 数组 元 素 的 tv. nsec 字段 的 值 
为 UTIME_NOR， 相 应 的 时 间 玲 就 设置 为 当前 时 间 ， 名 略 相 应 的 tv_sec 字段 。 

(3) 如 果 times 参数 指向 两 个 timespec 结构 的 数组 ， 任 一 数组 元 素 的 tv_nsec 字段 的 值 
为 UTIME_OMIT， 相 应 的 时 间 玲 保持 不 变 ， 忽 略 相应 的 tv_sec FR. 

(4) WE times 参数 指向 两 个 timespec 结构 的 数组 ， 且 tv nsec 字段 的 值 为 既 个 是 
UTIME NOW 也 不 是 UTIME_OMIT， 在 这 种 情况 下 ， 相 应 的 时 间 戳 设置 为 相应 的 tv_sec 和 
tv nsec 字段 的 值 。 

执行 这 些 函 数 所 要 求 的 优先 权 取决 于 times 参数 的 值 。 

。 如 果 times 是 一 个 空 指针 , 或 者 任 一 tv_nsec FARA uTIME NOW, 则 进程 的 有 效用 户 ID 

必须 等 于 该 文件 的 所 有 者 ID; 进程 对 该 文件 必须 具有 写 权 限 , 或 者 进程 是 一 个 超级 用 户 进程 。 

e WẸ times 是 非 空 指针 ， 并 且 任 一 tv nsec 字段 的 值 既 不 是 UTIME_NOW 也 不 是 

UTIME_OMIT， 则 进程 的 有 效用 户 ID 必须 等 于 该 文件 的 所 有 者 ID， 或 者 进程 必须 是 一 个 
超级 用 户 进 程 。 对 文件 只 具有 写 权 限 是 不 够 的 。 126 

o WẸ times 是 非 空 指针 ， 并 且 两 个 fv nsec 字段 的 值 都 为 UTIME_OMIT， 就 不 执行 任何 的 

权限 检查 。 

futimens 函数 需要 打开 文件 来 更 改 它 的 时 间 ，utimensat 函数 提供 了 一 种 使 用 文件 名 更 
改 文件 时 间 的 方法 。pathname 参数 是 相对 于 应 参数 进行 计算 的 ,应 要 么 是 打开 目录 的 文件 描述 
符 ， 要 么 设置 为 特殊 值 AT_FDCWD〔 强 制 通过 相对 于 调用 进程 的 当前 目录 计算 pathname). WMR 
pathname 指定 了 绝对 路 径 ， 那 么 应 参 数 被 忽略 。 

utimensat 的 flag 参数 可 用 于 进一步 修改 默认 行为 。 如 果 设 置 了 AT_SYMLINK_NOFOLLOW 
标志 ， 则 符号 链接 本 身 的 时 间 就 会 被 修改 (如果 路 径 名 指向 符号 链接 )。 默 认 的 行为 是 跟随 符号 
链接 ， 并 把 文件 的 时 间 改 成 符号 链接 的 时 间 。 

futimens 和 utimensat 函数 都 包含 在 POSIX.1 中 ， 第 3 个 函数 utimes 包含 在 Single 
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UNIX Specification 的 XSI 扩 展 选 项 中 。 


#include <sys/time.h> 


int utimes(const char *pathname, const struct timeval fimes[2]); 
函数 返回 值 ， 若 成 功 ， 返 回 0 did. JRIAI-1 
utimes 函数 对 路 径 名 进行 操作 。fimes 参数 是 指向 包含 两 个 时 间 惟 〈 访 问 时 间 和 修改 时 间 ) 
元 素 的 数组 的 指针 ， 两 个 时 间 惟 是 用 秒 和 微妙 表示 的 。 





struct timeval { 
time t tv sec; /* seconds */ 
long tv usec; /* microseconds */ 
) 


注意 ， 我 们 不 能 对 状态 更 改 时 间 st ctim G 节点 最 近 被 修改 的 时 间 ) 指定 一 个 值 ， 因 为 调 
用 utimes 函数 时 ， 此 字段 会 被 自动 更 新 。 

在 某 些 UNIX 版 本 中 , touch(1) 命 令 使 用 这 些 函 数 中 的 某 一 个 ,另外 ,标准 归档 程序 tar(1) 
和 cpio(1) 可 选 地 调用 这 些 函 数 ， 以 便 将 一 个 文件 的 时 间 值 设置 为 将 它 归 档 时 保存 的 时 间 。 


m SH 


4-21 的 程序 使 用 带 O_TRUNC 选项 的 open 函数 将 文件 长 度 截断 为 0， 但 并 不 更 改 其 访问 
时 间 及 修改 时 间 。 为 了 做 到 这 一 点 ， 首 先 用 stat 涵 数 得 到 这 些 时 间 ， 然 后 截断 文件 ， 最 后 再 用 
futimens MAE BATH IA. 


#include "apue.h" 
#include «fcntl.h» 


127| int 
main(int argc, char *argv[]) 
{ 
int i, fd; 
struct stat statbuf; 
struct timespec times[2]; 
for (i = 1; i < argc; i++) { 
if (stat(argv[i], &statbuf) < 0) | /* fetch current times */ 
err_ret("%s: stat error", argv[i]): 
continue; 
} 
if ((fd = open(argv[i], O_RDWR | O_TRUNC)) < 0) { /* truncate */ 
err ret("$s: open error", argv[il): 
continue; 
} 
times[0] = statbuf.st_atim; 
times[1] = statbuf.st mtim; 
if (futimens(fd, times) « 0) /* reset times */ 
err ret("$s: futimens error", argv[il): 
close (fd); 
} 


exit 0); 





图 4-21 futimens 函数 实例 
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可 以 用 以 下 Linux 命令 演示 图 4-21 中 的 程序 : 


$ 1s -1 changemod times 查看 长 度 和 最 后 修改 时 间 
-rwxr-xr-x 1 sar 13792 Jan 22 01:26 changemod 
-rwxr-xr-x 1 sar 13824 Jan 22 01:26 times 

$ 1s -lu changemod times 查看 最 后 访问 时 间 
-rwxr-xr-x 1 sar 13792 Jan 22 22:22 changemod 
-rwxr-xr-x 1 sar 13824 Jan 22 22:22 times 


$ date 打印 当天 日 期 

Fri Jan 27 20:53:46 EST 2012 

$ ./a.out changemod times 运行 图 4-21 的 程序 

$ 1s -1 changemod times 检查 结果 

-rwxr-xr-x 1 sar 0 Jan 22 01:26 changemod 

-rwxr-xr-x l sar 0 Jan 22 01:26 times 

$ ls -lu changemod times 检查 最 后 访问 时 间 

-rwxr-xr-x l sar 0 Jan 22 22:22 changemod 

-rwxr-xr-x 1 sar 0 Jan 22 22:22 times 

$ ls -le changemod times 检查 状态 更 改 时 间 

-rwxr-xr-x 1 sar 0 Jan 27 20:53 changemod 

-rwxr-xr-x l sar 0 Jan 27 20:53 times 

正如 我 们 所 预见 的 一 样 ， 最 后 修改 时 间 和 最 后 访问 时 间 未 变 。 但 是 ， 状 态 更 改 时 间 则 更 改 为 
程序 运行 时 的 时 间 。 "d 
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4.21 EB mkdir. mkdirat 和 rmdir 


JH mkdir 和 mkdirat 函数 创建 目录 ， 用 rmdir 函数 删除 目录 。 


#include <sys/stat.h> 


int mkdir(const char *pathname, mode_t mode); 


int mkdirat (int fd, const char *pathname, mode t mode); 


两 个 函数 返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 





这 两 个 函数 创建 一 个 新 的 空 目 录 。 其 中 ，. 和 . .目录 项 是 自动 创建 的 。 所 指定 的 文件 访问 权 
限 mode 由 进程 的 文件 模式 创建 屏蔽 字 修 改 。 

常见 的 错误 是 指定 与 文件 相同 的 mode《〈 只 指定 读 、 写 权限 )。 但 是 ， 对 于 目录 通常 至 少 要 设 
置 一 个 执行 权限 位 ， 以 允许 访问 该 县 录 中 的 文件 名 《见习 题 4.16)。 

按照 4.6 节 中 讨论 的 规则 来 设置 新 目录 的 用 户 ID 和 组 ID. 


| Solaris 10 和 Linux 3.2.0 也 使 新 目录 继承 父 目 录 的 设置 组 ID 位 。 这 就 使 得 在 新 目录 中 创建 的 
”文件 将 继承 该 目录 的 组 ID。 对 于 Linux, 文件 系统 的 实现 决定 是 否 支持 此 特征 。 例 如 ,ext2 、ext3 
| de ext4 文件 系统 用 mount(1) 命 令 的 一 个 选项 来 控制 是 否 支持 此 特征 。 但 是 ，Linux 的 UFS 文件 
:系统 实现 则 是 不 可 选择 的 ， 新 目录 继承 父 目 录 的 设置 组 ID 位 ， 这 仿效 了 历史 上 BSD 的 实现 。 在 
BSD 系统 中 ， 新 目录 的 组 ID 是 从 父 目 录 继 承 的 。 
基于 BSD 的 系统 并 不 要 求 在 目录 间 传 递 设置 组 ID 位 ,因为 不 论 设置 组 ID 位 如 何 , 新 创建 的 
文件 和 目录 总 是 继承 父 目 录 的 组 ID。 因 为 FreeBSD 8.0 和 Mac OS X 10.6.8 是 基于 4.4BSD 的 ， 它 
们 不 要 求 继承 设置 组 ID 位 。 在 这 些 平台 上 ， 新 创建 的 文件 和 目录 总 是 继承 父 目 录 的 组 ID, ix 5 
是 否 设置 了 设置 组 ID 位 无 关 。 
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早期 的 UNIX 版 本 并 没有 mkdir 函数 ， 它 是 由 4.2BSD 和 SVR3 引入 的 。 在 早期 版 本 中 ， 进 
程 要 调用 mknod 函数 创建 一 个 新 目录 ， 但 是 只 有 超级 用 户 进程 才能 使 用 mknod AM. ATRA 
这 一 点 ， 创 建 目录 的 命令 mkdir(1) 必 须 由 根 用 户 拥 有 ， 而 且 对 它 设置 了 设置 用 户 ID 位 。 要 通过 
一 个 进程 创建 一 个 目录 ， 必 须 用 system) PR SCRI mkdir(]) 命 令 。 


mkdirat 函数 与 mkdir 函数 类 似 。 当 应 参数 具有 特殊 值 AT_FDCWD 或 者 pathname 参数 指 
定 了 绝对 路 径 名 时 ，mkdirat 与 mkdir 完全 一 样 。 和 否则， 应 参数 是 一 个 打开 目录 ， 相 对 路 径 名 
根据 此 打开 目录 进行 计算 。 
129 用 rmdir 函数 可 以 删除 一 个 空 目录 。 空 目录 是 只 包含 .和 ,. .这 两 项 的 目录 。 





如 果 调 用 此 函数 使 目录 的 链接 计数 成 为 0， 并 且 也 没有 其 他 进程 打开 此 目录 ， 则 释放 由 此 目 
录 占 用 的 空间 。 如 果 在 链接 计数 达到 0 时 ， 有 一 个 或 多 个 进程 打开 此 目录 ， 则 在 此 函数 返回 前 删 
除 最 后 一 个 链接 及 .和 . .项 。 另 外 ， 在 此 目录 中 不 能 再 创建 新 文件 。 但 是 在 最 后 一 个 进程 关闭 它 
之 前 并 不 释放 此 目录 。( 即 使 另 一 些 进程 打开 该 目录 ， 它 们 在 此 目录 下 也 不 能 执行 其 他 操作 。 这 
样 处 理 的 原因 是 ， 为 了 使 rmdir 函数 成 功 执行 ， 该 目录 必须 是 空 的。) 


4.22 BAR 


对 某 个 只 录 具 有 访问 权限 的 任 一 用 户 都 可 以 读 该 目录 ， 但 是 ， 为 了 防止 文件 系统 产生 混乱 ， 
只 有 内 核 才 能 写 目 录 。 回 忆 4.5 节 ， 一 个 是 录 的 写 权 限 位 和 执行 权限 位 决定 了 在 该 目录 中 能 耕 创 
建新 文件 以 及 删除 文件 ， 它 们 并 不 表示 能 否 写 目 录 本 身 。 

目录 的 实际 格式 依赖 于 UNIX 系统 实现 和 文件 系统 的 设计 。 早 期 的 系统 (如 V7) 有 一 个 比 
较 简 单 的 结构 : 每 个 目录 项 是 16 个 字 节 ， 其 中 14 个 字 节 是 文件 名 ，2 个 字 节 是 i 节点 编号 。 而 
对 于 4.2BSD， 由 于 它 允 许 更 长 的 文件 名 ， 所 以 每 个 目录 项 的 长 度 是 可 变 的 。 这 就 意味 着 读 目 录 的 
程序 与 系统 相关 。 为 了 简化 读 目录 的 过 程 ，UNIX 现在 包含 了 一 套 与 目录 有 关 的 例 程 ， 它 们 是 
POSIX.1 的 一 部 分 。 很 多 实现 阻止 应 用 程序 使 用 read 函数 读 取 目 录 的 内 容 ， 由 此 进一步 将 应 用 
程序 与 目录 格式 中 与 实现 相关 的 细节 隅 离 。 


#include <dirent.h> 
DIR *opendir(const char *pathname) ; 


DIR *fdopendir(int fa); 
两 个 函数 返回 值 : BA. RET: AH, WA NULL 


struct dirent *readdir(DIR *dp); 
返回 值 ， 若 成 功 ， 返 回 指针 ; 车 在 目录 尾 或 出 错 ， 返 回 NULL 


void rewinddir(DIR *dp); 


int closedir(DIR *dp); 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


long telldir(DIR *dp); 


返回 值 ， 与 gp 关联 的 目录 中 的 当前 位 置 





void seekdir(DIR *dp, 
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fdopendir PIE FH BAZ SUSv4 (Single UNIX Specification 第 4 版 ) 中 ， 它 提供 了 一 种 
方法 ， 可 以 把 打开 文件 描述 符 转 换 成 目录 处 理 函 数 需要 的 DIR 结构 。 
telldir 和 seekdir 峭 数 不 是 基本 POSIX.1 标准 的 组 成 部 分 。 它 们 是 Single UNIX 
Specification 中 的 XSI 扩展 ， 所 以 可 以 期 望 所 有 符合 UNIX 系统 的 实现 都 会 提供 这 两 个 函数 。 
回忆 一 下 ， 在 图 1-3 EFF Os 命令 的 基本 实现 部 分 ) 使 用 了 其 中 几 个 函数 。 
定义 在 头 文件 <dirent .h> 中 的 dirent 结构 与 实现 有 关 。 实 现 对 此 结构 所 做 的 定义 至 少 包 
含 下 列 两 个 成 员 : 
ino t d ino; /* i-node number */ 
char d name[]; /* null-terminated filename */ 
POSIX.1 并 没有 定义 d. ino 项 ,因为 这 是 一 个 实现 特征 , 但 在 POSIX.1 的 XSI 扩展 中 定义 了 
d_ino。POSIX.1 在 此 结构 中 只 定义 了 d name A, 


注意 ，d_name 项 的 大 小 并 没有 指定 ， 但 必须 保证 它 能 包含 至 少 NAME_MAX 个 字 节 (不 包含 
终止 null 字 节 ， 回 忆 图 2-15)。 因 为 文件 名 是 以 null 字 节 结束 的 ， 所 以 在 头 文件 中 如 何 定义 数组 
d_name 并 无 多 大 关系 ， 数 组 大 小 并 不 表示 文件 名 的 长 度 。 

DIR 结构 是 一 个 内 部 结构 ， 上 述 7 个 函数 用 这 个 内 部 结构 保存 当前 正在 被 读 的 目录 的 有 
关 信 息 。 其 作用 类 似 于 FILE 结构 。FILE 结构 由 标准 IO 库 维 护 ， 我 们 将 在 第 5 章 中 对 它 进 
行 说 明 。 

由 opendir 和 fdopendir 返回 的 指向 DIR 结构 的 指针 由 另外 5 个 函数 使 用 ,opendir 执 
行 初始 化 操作 ， 使 第 一 个 readdir 返回 目录 中 的 第 一 个 目录 项 。DIR 结构 由 fdopendir 创建 
B readdir 返回 的 第 一 项 取决 于 传 给 £dopendir 函数 的 文件 描述 符 相 关联 的 文件 偏 移 量 。 注 
意 ， 目 录 中 各 目录 项 的 顺序 与 实现 有 关 。 它 们 通常 并 不 按 字 母 顺序 排列 。 


血 实例 


我 们 将 使 用 这 些 对 目录 进行 操作 的 例 程 编写 一 个 遍历 文件 层次 结构 的 程序 ， 其 目的 是 得 
到 如 图 4-4 中 所 示 的 各 种 类 型 的 文件 计数 。 图 4-22 的 程序 只 有 一 个 参数 , 它 说 明 起 点 路 径 名 ， 
从 该 点 开始 递归 降序 遍历 文件 层次 结构 。Solaris 提供 了 一 个 遍历 此 层次 结构 的 函数 ftw(3)， 
对 于 每 一 个 文件 它 都 调用 一 个 用 户 定 义 的 函数 。ftw 函数 的 问题 是 ， 对 于 每 一 个 文件 ， 它 都 
调用 stat 函数 ， 这 就 使 程序 跟随 符号 链接 。 例 如 ， 如 果 从 根 目 录 (root) 开始 ， 并 且 有 一 个 
名 为 /1ib 的 符号 链接 ， 它 指向 /usr/1ib， 则 所 有 在 目录 /usr/1ib 中 的 文件 都 会 被 计数 两 
次 。 为 了 纠正 这 一 点 ，Solaris 提供 了 另 一 个 函数 nftw(3)， 它 具有 一 个 停止 跟随 符号 链接 的 
选项 。 尽 管 可 以 使 用 nftw, 但 是 为 了 说 明 目 录 例 程 的 使 用 方法 ， 我们 还 是 编写 了 一 个 简单 的 
文件 遍历 程序 。 


在 SUSv4 中 ，nftw 包含 在 XSI 选项 中 。FreeBSD 8.0、Linux 3.2.0、Mac OS X 10.6.8 以 及 Solaris 10 
都 纪 括 了 该 函数 的 实现 。( 在 SUSv4 F, ftw 函数 已 被 标记 为 弃 用 。) 基于 BSD 4 UNIX 系统 则 有 另 一 个 
HI fts(3)， 它 提供 类 似 的 功能 。 该 函数 在 FreeBSD 8.0. Linux 32.0 fe Mac OS X 10.6.8 中 是 可 用 的 。 


#include "apue.h" 
#include <dirent.h> 
#include <limits.h> 
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/* function type that is called for each filename */ 
typedef int Myfunc {const char *, const struct stat *, int); 


Static Myfunc myfunc; 

static int myftw(char *, Myfunc *); 

static int dopath(Myfunc *); 

static long nreg, ndir, nblk, nchr, nfifo, nslink, nsock, ntot; 


int 
main(int argc, char *argv[I) 
{ 
int ret; 
if (arge != 2) 
err_quit("usage: ftw <starting-pathname>"); 
ret = myftw(argv[1], myfunc): /* does it all */ 
ntot = nreg + ndir + nblk + nchr + nfifo + nslink + nsock; 
if (ntot == 0) 
ntot = i; /* avoid divide by 0; print 0 for all counts */ 
printf("regular files $71d, $5.2f $$VXn", nreg, 
nreg*100.0/ntot}; 
printf ("directories = $71d, $5.2f &%\n", ndir, 
ndir*100.0/ntot); 
printf("block special 
nblk*100.0/ntot); 
printf("char special 
nchr*100.0/ntot); 
printf("FIFOs = $71d, $5.2f£f $$*WXn", nfifo, 
nfifo*100.0/ntot); 
printf ("symbolic links = $&71d, $5.2f %%\n", nslink, 
nslink*100.0/ntot); 
printf ("sockets = &71d, %5.2£ &%\n", nsock, 
nsock*100.0/ntot) ; 
exit (ret); 


$71d, $5.2f %%\n", nblk, 


$71d, $5.2f %$\n", nchr, 


Ra] a 


* Descend through the hierarchy, starting at "pathname", 
* The caller's func() is called for every file. 


7 

#define FTW F 1 /* file other than directory */ 

#define FTW D 2 /* directory */ 

$define FTW DNR 3 /* directory that can't be read */ 

#define FTW NS 4 /* file that we can't stat */ 

Static char *fullpath; /* contains full pathname for every file */ 


static size t pathlen; 


static int /* we return whatever func() returns */ 
myftw(char *pathname, Myfunc *func) 
( 
fullpath = path alloc(&pathlen); /* malloc PATH MAX*1 bytes */ 
/* ((Flgure 2.16)) */ 
if (pathlen <= strlen(pathname)) { 
pathlen = strlen (pathname) * 2; 
if ((fullpath = realloc(fullpath, pathlen)) -- NULL) 
err Sys("realloc failed"); 


4.22 


} 
strcpy(fullpath, pathname); 
return (dopath (func) }; 


Descend through the hierarchy, starting at "fullpath". 


* If "fullpath" is anything other than a directory, we lstat() it, 


"f 


call fune{), and return. For a directory, we call ourself 
recursively for each name in the directory. 


static int /* we return whatever func() returns */ 
dopath(Myfunc* func) 


( 


} 


struct stat statbuf; 
struct dirent *dirp; 
DIR *dp; 
int ret, ne 
if (lstat(fullpath, &statbuf) < 0) /* stat error */ 
return(func(fullpath, &statbuf, FTW N3)); 
if (S ISDIR(statbuf.st mode) -- 0) /* not a directory */ 
return(func(fullpath, &statbuf, FTW F)); 
/* 
* It's a directory. First call func() for the directory, 
* then process each filename in the directory. 
*/ 
if ((ret = func(fullpath, &statbuf, FTW D)) !- 0) 
return (ret); 
n = strlen(fullpath) ; 
if (n + NAME_MAX + 2 > pathlen) { /* expand path buffer */ 
pathlen *= 2; 
if ((fullpath = realloc(fullpath, pathlen)) == NULL) 
err_sys("realloc failed"); 
} 
fullpath[nt++] = '/'; 
fullpath[n] = 0; 
if ((dp = opendir(fullpath)) == NULL) /* can't read directory */ 
return(func(fullpath, &statbuf, FTW DNR)); 
while ((dirp = readdir(dp)) != NULL) { 
if (strcmp(dirp-»d name, ".") == | 
strcmp(dirp-»d name, "..") == 0) 
continue; /* ignore dot and dot-dot */ 
strcpy(&fullpath[n], dirp-»d name); /* append name after "/" */ 
if ((ret = dopath(func)) !- 0) /* recursive */ 
break; /* time to leave */ 
} 
fullpath[n-1] = 0; /* erase everything from slash onward */ 
if (closedir(dp) < 0) 
err ret("can't close directory %s", fullpath); 
return (ret); 


static int 
myfunc(const char *pathname, const struct stat *statptr, int type) 


{ 
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switch (type) { 
case FTW F: 
Switch (statptr-»st mode & S IFMT) { 


Case S IFREG: nreg-t-t; break; 
case S8 IFBLK: nblk++; break; 
case S_IFCHR: nchrt*; break; 
case S IFIFO: nfifot+; break; 
case S IFLNK: nslink++; break; 


case S IFSOCK: nsock+t; break; 
case S IFDIR: /* directories should have type = FTW D */ 
err dump("for S IFDIR for %s", pathname); 
} 
break; 
case FTW_D: 
ndirt++; 
break; 
case FTW_DNR: 
err ret("can't read directory %s", pathname); 
break; 
case FTW NS: 
err ret("stat error for %s", pathname); 
break; 
default: 
err dump("unknown type $d for pathname $s", type, pathname); 
) 
return(0); 


图 4-22 ”递归 降序 遍历 目录 层次 结构 ， 并 按 文件 类 型 计数 
在 程序 中 ， 我 们 提供 了 比 历 要 求 的 更 多 的 通用 性 ， 这 样 做 的 目的 是 为 了 具体 说 明 ftw 和 nftw 函数 
的 应 用 。 例 如 ， 函 数 myfunc 总 是 返回 0， 即 使 调用 它 的 函数 准备 了 处 理 非 0 返回 也 是 如 此 。 a" 


关于 降序 遍历 文件 系统 的 更 多 信息 ， 以 及 在 很 多 标准 UNIX fr (Itl find, 1s. tar 等 ) 
中 使 用 这 种 技术 的 情况 ， 请 参阅 Fowler. Korn 和 Vo[1989]. 


4.23 PAB chdir、fchdir 和 getcwd 


每 个 进程 都 有 一 个 当前 工作 目录 ， 此 目录 是 搜索 所 有 相对 路 径 名 的 起 点 〈 不 以 斜 线 开 始 的 路 
径 名 为 相对 路 径 名 )。 当 用 户 登 录 到 UNIX 系统 时 ， 其 当前 工作 日 录 通常 是 口令 文件 
(/etc/passwd) 中 该 用 户 登 录 项 的 第 6 个 字段 一 一 用 户 的 起 始 目录 (home directory )。 当 前 工 
作 目 录 是 进程 的 一 个 属性 ， 起 始 昌 录 则 是 登录 名 的 一 个 属性 。 

进程 调用 chdir 或 fchdir 函数 可 以 更 改 当前 工作 目录 。 


#include <unistd.h> 





int chdir(const char *pathname) ; 


int fchdir(int fd); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
在 这 两 个 函数 中 ， 分 别 用 pathname 或 打开 文件 描述 符 来 指定 新 的 当前 工作 目录 。 
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PES 


因为 当前 工作 目录 是 进程 的 一 个 属性 ， 所 以 它 只 影响 调用 chdir 的 进程 本 身 ， 而 不 影响 其 
他 进程 (我 们 将 在 第 8 章 更 详细 地 说 明 进 程 之 间 的 关系 )。 这 就 意味 着 图 4-23 的 程序 并 不 会 产生 
我 们 可 能 希望 得 到 的 结果 。 


#include "apue.h" 


int 
main(void) 
{ 
if (chdir("/tmp") « 0) 
err sys("chdir failed"); 
printf("chdir to /tmp succeeded\n"); 
exit(0); 


4-23 chdir 函数 实例 
如 果 编 译 图 4-23 程序 ， 并 且 调 用 其 可 执行 目标 代码 文件 mycd， 则 可 以 得 到 下 列 结果 : 
$ pwd 
/usr/lib 
$ mycd 
chdir to /tmp succeeded 


$ pwd 
/usr/lib 


从 中 可 以 看 出 ， 执 行 mycd 命令 的 shell 的 当前 工作 目录 并 没有 改变 ， 这 是 shell 执行 程序 工作 方 
式 的 一 个 副作用 。 每 个 程序 运行 在 独立 的 进程 中 ，shell 的 当前 工作 目录 并 不 会 随 着 程序 调用 
chdir 而 改变 。 由 此 可 见 , 为 了 改变 shell 进程 自己 的 工作 目录 , shel 应 当 直 接 调用 chdir BR, 
为 此 ，cd 命令 内 建 在 shell 中 。 

因为 内 核 必须 维护 当前 工作 目录 的 信息 ,所 以 我 们 应 能 获取 其 当前 值 。 RENE. AK 
为 每 个 进程 只 保存 指向 该 目录 v 节点 的 指针 等 目录 本 身 的 信息 ， 并 不 保存 该 目录 的 完整 路 
径 名 。 


Linux 内 核 可 以 确定 完整 路 径 名 。 完 整 路 径 名 的 各 个 组 成 部 分 分 布 在 mount KF dcache 表 
; 中 ， 然 后 进行 重新 组 装 ， 上 比如 在 读 取 /proc/self/cwd 符号 链接 时 。 


我 们 需要 一 个 函数 ， 它 从 当前 工作 目录 〈.〉 开始， 用 . .找到 其 上 一 级 目录 ， 然 后 读 其 目录 
项 ， 直 到 该 目录 项 中 的 i 节点 编号 与 工作 目录 i 节点 编号 相同 ， 这 样 地 就 找到 了 其 对 应 的 文件 名 。 
按照 这 种 方法 ， 逐 层 上 移 ， 直 到 过 到 根 ， 这 样 就 得 到 了 当前 工作 目录 完整 的 绝对 路 径 名 。 很 幸运 ， 
函数 getcwd 就 提供 了 这 种 功能 。 


#include <unistd.h> 


char *getcwd(char *buf, size t size); 


; 若 出 错 ， 返 回 NULL 


必须 向 此 函数 传递 两 个 参数 ， 一 个 是 缓冲 区 地 址 bwf， 男 一 个 是 缓冲 区 的 长 度 size 以 字 节 为 
单位 )。 该 缓冲 区 必须 有 足够 的 长 度 以 容纳 绝对 路 径 名 再 加 上 一 个 终止 null. 字 节 ， 否 则 返回 出 错 





110 第 4 章 文件 和 目录 


《请 回忆 2.5.5 节 中 有 关 为 最 大 长 度 路 径 名 分 配 空间 的 讨论 )。 


| 某 些 getcwd 的 早期 实现 允许 第 一 个 参数 buf 为 NULL。 在 这 种 情况 下 ， 此 函数 调用 malloc 
动态 地 分 配 size 字 节 数 的 空间 。 这 不 是 POSIX.1 或 Single UNIX Specification 的 所 属 部 分 ， 应 当 避 
| 免 使 用 。 


wl 


4-24 的 程序 将 工作 目录 更 改 至 一 个 指定 的 目录 ， 然 后 调用 getcwd， 最 后 打印 该 工作 
目录 。 如 果 运 行 该 程序 ， 则 可 得 

S ./a.out 

cwd = /var/spool/uucppublic 


$ 1s -1 /usr/spool 
lrwxrwxrwx 1 root 12 Jan 31 07:57 /usr/spool -» ../var/spool 


#include "apue.h" 
int 
main (void) 
{ 
char *ptr: 
size t size; 
if (chdir("/usr/spool/uucppublic") « 0) 
err sys("chdir failed"); 
ptr = path alloc(&size); /* our own function */ 
if (getcwd(ptr, size) -- NULL) 
err sys("getcwd failed"); 
printf ("cwd = $&sMn", ptr): 
exit(0); 


图 4-24 getcwd 函数 实例 
JER, chdir 跟随 符号 链接 〈 正 如 我 们 希望 的 ， 如 儿 4-17 中 所 示 )， 但 是 当 getcwd HAR 
树 上 济 遇 到 /var/spool 目录 时 ， 它 并 不 了 解 该 县 录 由 符号 链接 /usr/spool 所 指向 。 这 是 符 
号 链接 的 一 种 特性 。 B 


当 一 个 应 用 程序 需要 在 文件 系统 中 返回 到 它 工作 的 出 发 点 时 ，getcwd 函数 是 有 用 的 。 
在 更 换 工作 目录 之 前 ， 我 们 可 以 调用 getcwd 函数 先 将 其 保存 起 来 。 在 完成 了 处 理 后 ， 就 可 
将 所 保存 的 原 工 作 目 录 路 径 名 作为 调用 参数 传送 给 chdir, 这 样 就 返回 到 了 文件 系统 中 的 出 

fchdir 函数 向 我 们 提供 了 一 种 完成 此 任务 的 便捷 方法 。 在 更 换 到 文件 系统 中 的 不 同位 置 前 ， 
无 需 调 用 getcwd 函数 ， 而 是 使 用 open 打开 当前 工作 目录 ， 然 后 保存 其 返回 的 文件 描述 符 。 当 
希望 回 到 原 工作 目录 时 ， 只 要 简单 地 将 该 文件 描述 符 传送 给 fchdir。 


4.24 ”设备 特殊 文件 


st_dev 和 st_rdev 这 两 个 字段 经 常 引 起 混淆 ， 在 18.9 节 , 我 们 编写 ttyname 函数 时 ， 需 
要 使 用 这 两 个 字段 。 有 关 规 则 很 简单 : 
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。 每 个 文件 系统 所 在 的 存储 设备 都 由 其 主 、 次 设备 号 表示 。 设 备 号 所 用 的 数据 类 型 是 
基本 系统 数据 类 型 dev t。 主 设备 号 标识 设备 驱动 程序 ， 有 时 编码 为 与 其 通信 的 外 
BRR: 次 设备 号 标识 特定 的 子 设备 。 回 忆 图 4-13， 一 个 磁盘 驱动 器 经 常 包含 若干 个 
文件 系统 。 在 同一 磁盘 驱动 器 上 的 各 文件 系统 通常 具有 相同 的 主 设备 号 ， 但 是 次 设 
备 号 却 不 同 。 

。 我 们 通常 可 以 使 用 两 个 宏 : major 和 minor 来 访问 主 、 次 设备 号 ， 大 多 数 实现 都 定义 这 
两 个 宏 。 这 就 意味 着 我 们 无 需 关心 这 两 个 数 是 如 何 存 放 在 dev_t 对 象 中 的 。 


: 早期 的 系统 用 16 位 整 型 存放 设备 号 : 8 位 用 于 主 设备 号 ，8 位 用 于 次 设备 号 。FreeBSD 8.0 
| fe Mac OS X 10.6.8 使 用 32 #0, HPS 位 表示 主 设备 号 ，24 位 表示 次 设备 号 。 在 32 位 系 
| SP, Solaris 10 用 32 位 整 型 表示 dev 七 ， 其 中 14 位 用 于 主 设备 号 ，18 位 用 于 次 设备 号 。 在 
| 64 位 系统 中 ，Solaris 10 用 64 位 整 型 表示 dev 七 ， 主 设备 号 和 次 设备 号 各 用 其 中 的 32 位 表示 。 
| Æ Linux 3.2.0 上， 虽然 dev t 是 64 位 整 型 ， 但 其 中 只 有 12 位 用 于 主 设备 号 ，20 位 用 于 次 设 
| 备 号 。 

| —— POSDLI 说 明 dev t 类 型 是 存在 的 ， 但 没有 定义 它 包 含 什么 ， 或 如 何 取得 其 内 容 。 大 多 数 实 
| JL, 3.1 X major 和 minor， 但 在 哪 一 个 头 文件 中 定义 它们 则 与 实现 有 关 。 基 于 BSD 的 UNIX 
| 系统 将 它们 定义 在 <sys/types> 中 。Solaris 在 <sys/mkdev.h> 中 定义 了 它们 的 函数 原型 ， 

| 因为 在 <sys/sysmacros.h> 中 的 宏 定义 都 弃 用 了 。Linux 将 它们 定义 在 <sys/sysmacros .h> 
| 中， 而 该 头 文件 又 包含 在 <sys/type.h> 中 。 


© 系统 中 与 每 个 文件 名 关联 的 st dev 值 是 文件 系统 的 设备 号 ， 该 文件 系统 包含 了 这 一 文 
件 名 以 及 与 其 对 应 的 i 节点 。 
© 只 有 字符 特殊 文件 和 块 特殊 文件 才 有 st_rdev 值 。 此 值 包含 实际 设备 的 设备 号 。 


Sm 实例 
4-25 的 程序 为 每 个 命令 行 参 数 打印 设备 号 ， 另 外， 若 此 参数 引用 的 是 字符 特殊 文件 或 块 特 
殊 文 件 ， 则 还 打印 该 特殊 文件 的 st rdev fü. 
finclude "apue.h" 
#ifdef SOLARIS 


#include <sys/mkdev.h> 
fendif 





int 
main(int argc, char *argv[]) 
{ 
int i: 
struct stat buf; 
for (1 = 1; i < argc; i++) 1 
printf("$s: ", argv[i]); 
if (stat(argv[i], &buf) < 0) { 
err ret("stat error"); 
continue; 
! 
printf ("dev = $d/$d", major(buf.st dev), minor(buf.st dev)); 
if (S ISCHR(buf.st mode) |] S ISBLK(buf.st mode)) ( 
printf(" ($5) rdev = %d/%d", 
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(S ISCHR(buf.st mode)) ? "character" : "block", 
major(buf.st rdev), minor(buf.st, rdev)); 
} 
printf ("Xn"); 
) 
exit(0); 


4-25 打印 st dev Ml st_rdev Ë 
在 Linux 上 运行 此 程序 得 到 下 面 的 输出 : 


$ ./a.out / /home/sar /dev/tty[01} 

/: dev = 8/3 

/home/sar: dev = 8/4 

/dev/tty0: dev = 0/5 (character) rdev = 4/0 

/dev/ttyl: dev - 0/5 (character) rdev - 4/1 

$ mount 哪些 目录 安装 在 哪些 设备 上 ? 
/dev/sda3 on / type ext3 (zw errors=remount-ro, commit=0) 
/dev/sdad on /home type ext2 (rw, commit=0) 

$ 1s -l /dev/tty[0O1] /dev/sda[34] 


brw-rw---- 1 root 8, 3 2011-07-01 11:08 /dev/sda3 
brw-rw---- 1 root 8, 4 2011-07-01 11:08 /dev/sda4 
Crw--w---- 1 root 4, 0 2011-07-01 11:08 /dev/ttyO 
Crw------- 1 root 4, 1 2011-07-01 11:08 /dev/ttyl 


传 给 该 程序 的 前 两 个 参数 是 目录 (/ 和 /home/sar)， 后 两 个 参数 是 设备 名 /dev/tty[01]。( 我 
们 用 shell 正则 表达 式 语言 以 缩短 所 需 的 输入 量 。sheil 将 字符 串 /daev/tty[01] 扩 展 为 
/dev/tty0 /dev/ttyl.) 

我 们 期 望 设备 是 字符 特殊 文件 。 从 程序 的 输出 可 见 ， 根 目录 和 /home/sar 目录 的 设备 号 不 
同 ， 这 表示 它们 位 于 不 同 的 文件 系统 中 。 运 行 mount(1) 命 令 可 以 证 明了 这 一 点 。 

然后 用 1s 命令 查看 由 mount 命令 报告 的 两 个 磁盘 设备 和 两 个 终端 设备 。 这 两 个 磁盘 设备 是 
块 特殊 文件 ， 而 两 个 终端 设备 是 字符 特殊 文件 。( 通 常 ， 只 有 那些 包含 随机 访问 文件 系统 的 设备 
类 型 是 块 特殊 文件 设备 ， 如 硬盘 驱动 器 、 软 盘 驱 动 器 和 CD-ROM 等 。UNIX 的 早期 版 本 支持 磁带 
存放 文件 系统 ， 但 这 从 未 广泛 使 用 过 。) 

注意 ， 两 个 终端 设备 (st devo 的 文件 名 和 i 节点 在 设备 0/5 上 (devtmpfs 伪 文 件 系统 ， 

它 实现 了 /dev 文件 系统 )， 但 是 它们 的 实际 设备 号 是 40 和 4/1。 


4.25 ”文件 访问 权限 位 小 结 


我 们 已 经 说 明了 所 有 文件 访问 权限 位 , 其 中 某 些 位 有 多 种 用 途 。 图 4-26 列 出 了 所 有 这 些 权 限 
位 ， 以 及 它们 对 普通 文件 和 目录 文件 的 作用 。 

最 后 9 个 常量 还 可 以 分 成 如 下 3 28: 

S IRWXU = S IRUSR| S IWUSR | S IXUSR 


S IRWXG = S_IRGRP | S_IWGRP S IXGRP 
S IRWXO = S_IROTH | S IWOTH | S. IXOTH 
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S ISUID 设置 用 户 ID | 执行 时 设置 有 效用 户 ID (CRER) 
S_ISGID 设置 组 ID 若 组 执行 位 设置 ， 则 执行 时 设置 有 效 将 在 目录 中 创建 的 新 文件 的 组 ID 
组 ID; 否则 使 强制 性 锁 起 作用 (车 支持 ) | 设置 为 目录 的 组 ID 


在 交换 区 缓存 程序 正文 (车 支 持 ) 限 止 在 自 录 中 删除 和 重 命名 文件 


S_IRUSR 用 户 读 许可 用 户 读 文 件 许可 用 户 读 目 录 项 

S IWUSR APS 许可 用 户 写 文件 许可 用 户 在 目录 中 删除 和 创建 文件 
S IXUSR 用 户 执 行 许可 用 户 执行 文件 许可 用 户 在 目录 中 搜索 给 定 路 径 名 
S IRGRP 组 读 许可 组 读 文件 许可 组 读 目 录 项 

S_IWGRP 组 写 许可 组 写 文件 许可 组 在 目录 中 删除 和 创建 文件 
S IXGRP 组 执行 许可 组 执行 文件 许可 组 在 目录 中 搜索 给 定 路 径 名 

S_IROTH 其 他 读 许可 其 他 读 文件 许可 其 他 读 目 录 项 

S IWOTH 其 他 写 许可 其 他 写 文 件 许可 其 他 在 目录 中 删除 和 创建 文件 


其 他 执行 许可 其 他 执行 文件 


4-26 ”文件 访问 权限 位 小 结 


许可 其 他 在 目录 中 搜索 给 定 路 径 名 





S IXOTH 





4.26 WS 


本 章 内 容 围绕 stat 函数 ， 详 细 介 绍 了 stat 结构 中 的 每 一 个 成 员 。 这 使 我 们 对 UNIX 文件 
和 目录 的 各 个 属性 都 有 所 了 解 。 我 们 讨论 了 文件 和 目录 在 文件 系统 中 是 如 何 设 计 的 以 及 如 何 使 用 
文件 系统 命名 空间 。 对 文件 和 目录 的 所 有 属性 以 及 对 文件 和 目录 进行 操作 的 所 有 函数 的 全 面 了 
解 ， 对 于 UNIX 编程 是 非常 重要 的 。 


习题 
4.1 用 stat 函数 替换 图 4-3 程序 中 的 1stat 函数 ， 如 若 命 令 行 参 数 之 一 是 符号 链接 ， 会 发 生 
什么 变化 ? 


42 “如 果 文 件 模式 创建 屏蔽 字 是 777 (八进制), 结果 会 怎样 ? 用 shell 的 umask 命令 验证 该 结果 。 

4.3 ”关闭 一 个 你 所 拥有 文件 的 用 户 读 权限 ， 将 导致 拒绝 你 访问 自己 的 文件 ， 对 此 进行 验证 。 

44 ”创建 文件 foo 和 bar 后， 运行 图 4-9 的 程序 ， 将 发 生 什 么 情况 ? 

4S 412 节 中 讲 到 一 个 普通 文件 的 大 小 可 以 为 0， 同 时 我 们 又 知道 st size 字段 是 为 目录 或 符 
号 链接 定义 的 ， 那 么 目录 和 符号 链接 的 长 度 是 否 可 以 为 0? 

4.6 ”编写 一 个 类 似 cp(1) 的 程序 ， 它 复制 包含 空洞 的 文件 ， 但 不 将 字 节 0 写 到 输出 文件 中 去 。 

47 在 4.12 节 1s 命令 的 输出 中 ，core 和 core.copy 的 访问 权限 不 同 ， 如 果 创 建 两 个 文件 时 
umask 没有 变 ， 说 明 为 什么 会 发 生 这 种 差别 。 

4.8 ”在 运行 图 4-16 的 程序 时 ， 使 用 了 df(1) 命 令 来 检查 空闲 的 磁盘 空间 。 为 什么 不 使 用 du (1) 
命令 ? 

4.9 4-20 中 显示 unlink 消 数 会 修改 文件 状态 更 改 时 间 ， 这 是 怎样 发 生 的 ? 

4.10 422 节 中 ， 系 统 对 可 打开 文件 数 的 限制 对 myftw 函数 会 产生 什么 影响 ? 

411 在 4.22 节 中 的 myftw 从 不 改变 其 目录 ， 对 这 种 处 理 方法 进行 改动 ; 每 次 遇 到 一 个 目录 就 用 
其 调用 chdir, 这 样 每 次 调用 1stat 时 就 可 以 使 用 文件 名 而 非 路 径 名 ， 处 理 完 所 有 的 目录 
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4.12 


4.13 
4.14 


4.16 


4.17 


项 后 执行 chdir("..") 。 比 较 这 种 版 本 的 程序 和 书 中 程序 的 运行 时 间 。 

每 个 进程 都 有 一 个 根 目 录用 于 解析 绝对 路 径 名 ， 可 以 通过 chroot RAMBMAR. EF 
册 中 查阅 此 函数 。 说 明 这 个 函数 什么 时 候 有 用 。 

如 何 只 设置 两 个 时 间 值 中 的 一 个 来 使 用 utimes PRX? 

有 些 版 本 的 finger(1) 命 令 输 出 “New mail received ...” 和 “unread since ...”， 其 中 ... 表 示 
相应 的 日 期 和 时 间 。 程 序 是 如 何 决定 这 些 日 期 和 时 间 的 ? 

用 cpio(1) 和 tar(1) 命 令 检 查 档 案 文件 的 格式 (请 参阅 《UNIX 程序 员 手 册 》 第 5 部 分 中 的 
说 明 )。3 个 可 能 的 时 间 值 中 哪儿 个 是 为 每 一 个 文件 保存 的 ? 你 认为 文件 复原 时 ， 文 件 的 访 
问 时 间 是 什么 ? 为 什么 ? 

UNIX 系统 对 目录 树 的 深度 有 限制 吗 ? 编写 一 个 程序 循环 ， 在 每 次 循环 中 ， 创 建 目 录 ， 并 将 
该 目录 更 改 为 工作 目录。 确保 叶 节 点 的 绝对 路 径 名 的 长 度 大 于 系统 的 PATH MAX 限制 。 可 
以 调用 getcwd 得 到 目录 的 路 径 名 吗 ? 标准 UNIX 系统 工具 是 如 何 处 理 长 路 径 名 的 ? 对 目 
录 可 以 使 用 tar 或 cpio 命令 归档 吗 ? 

3.16 节 中 描述 了 /dev/fq 特征 。 如 果 每 个 用 户 都 可 以 访问 这 些 文件 ， 则 其 访问 权限 必须 为 
rw-zw-zw-。 有 些 程序 创建 输出 文件 时 ， 先 删除 该 文件 以 确保 该 文件 名 不 存在 ,忽略 返回 码 。 


unlink (path); 
if ( (fd = creat(path, FILE MODE)) < 0) 
err_sys(...)¢ 


如 果 path 是 /dev/fd/1， 会 出 现 什么 情况 ? 





标准 IO 库 





5.1 引言 


本 章 讲 述 标准 IO FE. 不仅 是 UNIX, 很 多 其 他 操作 系统 都 实现 了 标准 UO 库 ， 所 以 这 个 库 由 
ISO C 标准 说 明 。Single UNIX Specification 对 ISO C 标准 进行 了 扩充 ， 定 义 了 另外 一 些 接口 。 

标准 VO 库 处 理 很 多 细节 ， 如 缓冲 区 分 配 、 以 优化 的 块 长 度 执行 UO 等 。 这 些 处 理 使 用 户 不 
必 担 心 如 何 选择 使 用 正确 的 块 长 度 〈《 如 3.9 节 中 所 述 )。 这 使 得 它 便于 用 户 使 用 ,但 是 如 果 我 们 不 
深入 地 了 解 VO 库 函 数 的 操作 ， 也 会 带 来 一 些 问题 。 


| 标准 VO 库 是 由 Dennis Ritchie 在 1975 年 左右 编写 的 。 它 是 Mike Lesk 编写 的 可 移植 VO 库 的 
| 主要 修改 版 本 。 令 人 惊讶 的 是 ，35 年 来 ， 几 乎 没有 对 标准 VO 库 进行 修改 。 


5.2 iF] FILE WR 


在 第 3 BH, 所 有 VO 函数 都 是 围绕 文件 描述 符 的 。 当 打开 一 个 文件 时 , 即 返回 一 个 文件 描述 符 ， 
然后 该 文件 描述 符 就 用 于 后 续 的 VO 操作 。 而 对 于 标准 VO 库 ， 它 们 的 操作 是 围绕 流 (stream) 进行 
的 (请 勿 将 标准 IO 术语 流 与 System V 的 STREAMS VO 系统 相 混淆 , STREAMS IO 系统 是 System V 
的 组 成 部 分 ，Single UNIX Specification 则 将 其 标准 化 为 XSI STREAMS 选项 ， 但 是 在 SUSv4 中 已 经 
将 其 标记 为 弃 用 )。 当 用 标准 VO 库 打开 或 创建 一 个 文件 时 ， 我 们 已 使 一 个 流 与 一 个 文件 相关 联 。 

对 于 ASCI 字符 集 ， 一 个 字符 用 一 个 字 节 表示 。 对 于 国际 字符 集 ， 一 个 字符 可 用 多 个 字 节 表 
示 。 标 准 VO 文件 流 可 用 于 单字 节 或 多 字 节 〈“ 宽 ”) 字符 集 。 流 的 定向 (stream's orientation) W 
定 了 所 读 、 写 的 字符 是 单字 节 还 是 多 字 节 的 。 当 一 个 流 最 初 被 创建 时 ， 它 并 没有 定向 。 如 若 在 未 
定向 的 流 上 使 用 一 个 多 字 节 UO 函数 〈 见 <wchar .h>)， 则 将 该 流 的 定向 设置 为 宽 定向 的 。 若 在 
未 定向 的 流 上 使 用 一 个 单字 节 IO 函数 ， 则 将 该 流 的 定向 设 为 字 节 定向 的 。 只 有 两 个 函数 可 改变 
流 的 定向 。freopen 函数 〈 稍 后 讨论 ) 清除 一 个 流 的 定向 ，fwide 函数 可 用 于 设置 流 的 定向 。 


#include <stdio.h> 


include <wchar.h> 


int fwide(FILE *fp, int mode); 
返回 值 : 若 流 是 宽 定向 的 ， 返 回 正 值 ， 若 流 是 字 节 定 向 的 ， 返 回 负 值 ， 若 流 是 未 定向 的 ， 返 回 0 





根据 mode 参数 的 不 同 值 ，fwide 函数 执行 不 同 的 工作 。 
e 如若 mode 参数 值 为 负 ，fwide 将 试图 使 指定 的 流 是 字 节 定向 的 。 
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s。 如 若 mode 参数 值 为 正 ，fwide 将 试图 使 指定 的 流 是 宽 定向 的 。 

。 如 若 mode 参数 值 为 0，fwide 将 不 试图 设置 流 的 定向 ， 但 返回 标识 该 流 定 向 的 值 。 

注意 ，fwide 并 不 改变 已 定向 流 的 定向 。 还 应 注意 的 是 ，fwiae THRE Re, MF 
流 是 无 效 的 ， 那 么 将 发 生 什 么 昵 ? 我 们 唯一 可 依靠 的 是 ， 在 调用 fwide 前 先 清 除 errno, M 
fwide 返回 时 检查 errno 的 值 。 在 本 书 的 其 余部 分 ， 我 们 只 涉及 字 节 定向 流 。 

当 打 开 一 个 流 时 ， 标 准 IO 函数 fopen (参考 5.5 节 ) 返回 一 个 指向 FILE 对 象 的 指针 。 该 对 
象 通常 是 一 个 结构 ， 它 包含 了 标准 IO 库 为 管理 该 流 需 要 的 所 有 信息 ， 包 括 用 于 实际 IO 的 文件 描 
述 符 、 指 向 用 于 该 流 缓冲 区 的 指针 、 缓 冲 区 的 长 度 、 当 前 在 缓冲 区 中 的 字符 数 以 及 出 错 标志 等 。 

应 用 程序 没有 必要 检验 FILE 对 象 。 为 了 引用 一 个 流 ， 需 将 FILE 指针 作为 参数 传递 给 每 个 
标准 VO 函数 。 在 本 书 中 ， 我 们 称 指向 FILE 对 象 的 指针 〈 类 型 为 FILE* ) 为 文件 指针 。 

在 本 章 中 ， 我 们 在 UNIX 系统 环境 中 说 明 标 准 VO 库 。 正 如 前 述 ， 此 标准 库 已 移植 到 UNIX 之 

外 的 很 多 系统 中 。 但 是 为 了 说 明 该 库 实现 的 一 些 细 节 ， 我 们 将 讨论 其 在 UNIX 系统 上 的 典型 实现 。 


5.3 ”标准 输入 、 标 准 输出 和 标准 错误 


对 一 个 进程 预定 义 了 3 个 流 ， 并 且 这 3 个 流 可 以 自动 地 被 进程 使 用 ， 它 们 是 : 标准 输入 、 标 准 输出 
和 标准 错误 。 这 些 流 引 用 的 文件 与 在 3.2 节 中 提 到 文件 描述 符 STDIN FILENO. STDOUT FILENO 和 
STDERR_FILENO 所 引用 的 相同 。 

这 3 个 标准 VO 流通 过 预定 义 文 件 指针 stdin. stdout 和 stderr 加 以 引用 。 这 3 个 文件 
指针 定义 在 头 文件 <stdio.h> 中 。 


5.4 缓冲 


标准 VO 库 提供 缓冲 的 目的 是 尽 可 能 减少 使 用 read 和 write 调用 的 次 数 〈 见 图 3-6， 其 中 
显示 了 在 不 同 缓 溃 区 长 度 情况 下 ， 执 行 VO 所 需 的 CPU 时 间 量 )。 它 也 对 每 个 IO 流 自 动 地 进行 
缓冲 管理 ， 从 而 避免 了 应 用 程序 需要 考虑 这 一 点 所 带 来 的 麻烦 。 遗 憾 的 是 ， 标 准 VO ROA 
惑 的 也 是 它 的 缓冲 。 

标准 VO 提供 了 以 下 3 种 类 型 的 缓冲 。 

(1) 全 缓冲 。 在 这 种 情况 下 ， 在 填 满 标准 VO 缓冲 区 后 才 进 行 实际 VO 操作 。 对 于 驻 留 在 磁 
盘 上 的 文件 通常 是 由 标准 VO 库 实施 全 缓冲 的 。 在 一 个 流 上 执行 第 一 次 IO 操作 时 ， 相 关 标 准 VO 
函数 通常 调用 malloc ( 见 7.8 节 ) 获得 需 使 用 的 缓冲 区 。 

术语 冲洗 (flush) 说 明 标 准 VO 缓冲 区 的 写 操作 。 缓 冲 区 可 由 标准 VO 例 程 自动 地 冲洗 〈 例 
如 ， 当 填 满 一 个 缓冲 区 时 )， 或 者 可 以 调用 函数 fflush 冲洗 一 个 流 。 值 得 注意 的 是 ， 在 UNIX 
环境 中 ，flush 有 两 种 意思 。 在 标准 VORA, flush GHA) 意味 着 将 缓冲 区 中 的 内 容 写 到 磁盘 
上 该 缓冲 区 可 能 只 是 部 分 填 满 的 )。 在 终端 驱动 程序 方面 (例如 ,在 第 18 章 中 所 述 的 tcflush 
函数 )，flush〈 刷 清 〉 表 示 丢 弃 已 存储 在 缓冲 区 中 的 数据 。 

(2) 行 缓冲 。 在 这 种 情况 下 ， 当 在 输入 和 输出 中 遇 到 换行 符 时 ， 标 准 IO 库 执行 VO 操作 。 
这 允许 我 们 一 次 输出 一 个 字符 (用 标准 VO 函数 fputc), 但 只 有 在 写 了 一 行 之 后 才 进 行 实际 VO 
操作 。 当 流 涉及 一 个 终端 时 (如 标准 输入 和 标准 输出 )， 通 常 使 用 行 缓冲 。 

对 于 行 缓冲 有 两 个 限制 。 第 一 ， 因 为 标准 VO 库 用 来 收集 每 一 行 的 缓冲 区 的 长 度 是 固定 的 ， 
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所 以 只 要 填 满 了 缓冲 区 ， 那 么 即使 还 没有 写 一 个 换行 符 ， 也 进行 VO 操作 。 第 二 ， 任 何 时 候 只 要 
通过 标准 VO FERKA a) 一 个 不 带 缓冲 的 流 ， 或 者 (b) 一 个 行 缓冲 的 流 《〈 它 从 内 核 请 求 需要 
数据 ) 得 到 输入 数据 ， 那 么 就 会 冲洗 所 有 行 缓冲 输出 流 。 在 (CO 中 带 了 一 个 在 括号 中 的 说 明 ， 
其 理由 是 ， 所 需 的 数据 可 能 已 在 该 缓冲 区 中 ， 它 并 不 要 求 一 定 从 内 核 读 数据 。 很 明显 ， 从 一 个 不 
带 缓冲 的 流 中 输入 〈 即 (a) 项 ) 需要 从 内 核 获 得 数据 。 

(3) 不 带 缓冲 。 标 准 IO 库 不 对 字符 进行 缓冲 存储 。 例 如 ， 若 用 标准 VO 函数 fputs 写 15 
个 字符 到 不 带 缓冲 的 流 中 ， 我 们 就 期 望 这 15 个 字符 能 立即 和 输出， 很 可 能 使 用 3.8 节 的 write K 
数 将 这 些 字符 写 到 相关 联 的 打开 文件 中 。 

标准 错误 流 stderr 通常 是 不 带 缓冲 的 ， 这 就 使 得 出 错 信息 可 以 尽快 显示 出 来 ， 而 不 管 它们 
是 否 含有 一 个 换行 符 。 

ISO C 要 求 下 列 缓冲 特征 。 

e 当 且 仅 当 标准 输入 和 标准 输出 并 不 指向 交互 式 设备 时 ， 它 们 才 是 全 缓冲 的 。 

。 标准 错误 决 不 会 是 全 缓冲 的 。 

但 是 ， 这 并 没有 告诉 我 们 如 果 标 准 输 入 和 标准 输出 指向 交互 式 设备 时 ， 它 们 是 不 带 缓 冲 的 还 
是 行 缓冲 的 ， 以 及 标准 错误 是 不 带 缓冲 的 还 是 行 缓冲 的 。 很 多 系统 默认 使 用 下 列 类 型 的 缓冲 ; 

e 标准 错误 是 不 带 缓冲 的 。 

。 若是 指向 终端 设备 的 流 ， 则 是 行 缓冲 的 ;否则 是 全 缓冲 的 。 

| 本 书 讨论 的 4 种 平台 都 遵从 标准 VO 缓冲 的 这 些 惯例 ， 标 准 错误 是 不 带 缓冲 的 ， 打 开 至 终端 
设备 的 流 是 行 缓冲 的 ， 其 他 流 是 全 缓冲 的 。 

我 们 将 在 5.12 节 和 图 5-1 对 标准 VO 缓冲 做 更 详细 的 说 明 。 

对 任何 一 个 给 定 的 流 ， 如 果 我 们 并 不 喜欢 这 些 系统 默认 ， 则 可 调用 下 列 两 个 函数 中 的 一 个 更 
改 缓冲 类 型 。 
#include <stdio.h> 


void setbuf(FILE *restrict fp, char *restrict buf); 


int setvbuf(FILE *restrict fp, char *restrict buf, int mode, size t size); 


返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 非 0 





这 些 函 数 一 定 要 在 流 已 被 打开 后 调用 〈 这 是 十 分 明显 的 ， 因 为 每 个 函数 都 要 求 一 个 有 效 的 文 
件 指针 作为 它们 的 第 一 个 参数 )， 而 且 也 应 在 对 该 流 执行 任何 一 个 其 他 操作 之 前 调用 。 

可 以 使 用 setbuf 函数 打开 或 关闭 缓冲 机 制 。 为 了 带 缓冲 进行 VO. BR buf 必须 指向 一 个 
长 度 为 BUFSIZ 的 缓冲 区 〈 该 常量 定义 在 <stdio.h> 中 )。 通 常 在 此 之 后 该 流 就 是 全 缓冲 的 ， 但 
是 如 果 该 流 与 一 个 终端 设备 相关 ,那么 某 些 系统 也 可 将 其 设置 为 行 缓冲 的 。 为 了 关闭 缓冲 ， 将 buf 
设置 为 NULL。 

使 用 setvbuf， 我 们 可 以 精确 地 说 明 所 需 的 缓冲 类 型 。 这 是 用 mode 参数 实现 的 : 

_IOFBF 全 缓冲 

_IOLBF 行 缓冲 

_IONBF 不 带 缓冲 

如 果 指 定 一 个 不 带 缓冲 的 流 ， 则 忽略 buf 和 size 参数 。 如 果 指 定 全 缓冲 或 行 缓冲 ， 则 buf 和 
size 可 选择 地 指定 一 个 缓冲 区 及 其 长 度 。 如 果 该 流 是 带 缓冲 的 ， 而 buf 是 NULL， 则 标准 LO EK 
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自动 地 为 该 流 分 配 适 当 长 度 的 缓冲 区 。 适 当 长 度 指 的 是 由 常量 BUFSIz 所 指定 的 值 。 


某 些 C 示 数 库 实现 使 用 stat 结构 中 的 成 员 st_blksize 所 指定 的 值 ( 见 4.2 节 ) 决定 最 佳 
VO 缓冲 区 长 度 。 在 本 章 的 后 续 内 容 中 可 以 看 到 ，GNU C 函数 库 就 使 用 这 种 方法 。 


图 5-1 列 出 了 这 两 个 函数 的 动作 ， 以 及 它们 的 各 个 选项 。 







setvbut 
: 


5-1 setbuf 和 setvbuf 函数 


要 了 解 ， 如 果 在 一 个 函数 内 分 配 一 个 自动 变量 类 的 标准 IO 缓冲 区 ， 则 从 该 函数 返回 之 前 ， 
必须 关闭 该 流 〈7.8 节 将 对 此 做 更 多 讨论 )。 另 外 ， 其 些 实现 将 缓冲 区 的 一 部 分 用 于 存放 它 自己 的 
管理 操作 信息 ， 所 以 可 以 存放 在 缓冲 区 中 的 实际 数据 字 节 数 少 于 size。 一 般 而 言 ， 应 由 系统 选择 
缓冲 区 的 长 度 ， 并 自动 分 配 缓冲 区 。 在 这 种 情况 下 关闭 此 流 时 ， 标 准 IO 库 将 自动 释放 缓冲 区 。 

任何 时 候 ， 我 们 都 可 强制 冲洗 一 个 流 。 





此 函数 使 该 流 所 有 未 写 的 数据 都 被 传送 至 内 核 。 作 为 一 种 特殊 情形 ， 如 车 刀 Æ NULL, Wie 
函数 将 导致 所 有 输出 流 被 冲洗 。 


5.5 打开 流 


下 列 3 个 函数 打开 一 个 标准 VO 流 。 


#Hinclude <stdio.h> 


FILE *fopen(const char *restrict pathname, const char *restrict type); 


FILE *freopen (const char *restrict pathname, const char *restrict type, FILE *restrict fp); 


FILE *fdopen(int fd, const char *type): 





3 个 函数 的 返回 值 :者 成 功 ， 返 回 文件 指针 ; 若 出 错 ， 返 回 NULL 


这 3 个 函数 的 区 别 如 下 。 

(1) fopen 函数 打开 路 径 名 为 pathname 的 一 个 指定 的 文件 。 

(2) freopen 函数 在 一 个 指定 的 流 上 打开 一 个 指定 的 文件 ， 如 若 该 流 已 经 打开 ， 则 先 关闭 该 
流 。 若 该 流 已 经 定向 ， 则 使 用 freopen 清除 该 定向 。 此 函数 一 般 用 于 将 一 个 指定 的 文件 打开 为 
一 个 预定 义 的 流 ， 标准 输入 、 标 准 输出 或 标准 错误 。 

(3) fdopen 函数 取 一 个 已 有 的 文件 描述 符 〈 我 们 可 能 从 open. dup. dup2. fentl. pipe. 


5.5 打开 流 119 


socket. socketpair Bk accept 函数 得 到 此 文件 描述 符 )， 并 使 一 个 标准 的 VO 流 与 该 描述 符 
相 结 合 。 此 函数 常用 于 由 创建 管道 和 网 络 通信 通道 函数 返回 的 描述 符 。 因 为 这 些 特 殊 类 型 的 文件 
不 能 用 标准 VO 函数 fopen 打开 ， 所 以 我 们 必须 先 调用 设备 专用 函数 以 获得 一 个 文件 描述 符 ， 然 
后 用 £dopen 使 一 个 标准 VO 流 与 该 描述 符 相 结合 。 


| fopen 和 freopen X ISOC UNDE m ISO C 并 不 涉及 文件 描述 符 ， 所 以 仅 有 POSIX.1 
| 具有 fdopen。 
type 参数 指定 对 该 VO 流 的 读 、 写 方式 , ISO C 规定 type 参数 可 以 有 15 种 不 同 的 值 ， 如 图 5-2 所 示 。 


r 或 rb 为 读 而 打开 O RDONLY 
w BE wb 把 文件 截断 至 0 长 ， 或 为 写 而 创建 O WRONLY|O CREAT|O TRUNC 


a gk ab 追加 ， 为 在 文件 尾 写 而 打开 ， 或 为 写 而 创建 O WRONLY|O CREAT|O APPEND 
r+ 或 r+b 或 rb+ | 为 读 和 写 而 打开 O RDWR 

w+ 或 wtb 或 wb+ | 把 文件 截断 至 0 长 ， 或 为 读 和 写 而 打开 O RDWR|O CREAT|O TRUNC 
a+ 或 atb 或 ab+ | 为 在 文件 尾 读 和 写 而 打开 或 创建 O_RDWR|O_CREAT | O_APPEND 





图 5-2 打开 标准 VO 流 的 type 参数 

使 用 字符 b 作为 type 的 一 部 分 ,这 使 得 标准 IO 系统 可 以 区 分 文本 文件 和 二 进 制 文件 。 因 为 UNIX 内 
核 并 不 对 这 两 种 文件 进行 区 分 ， 所 以 在 UNIX 系统 环境 下 指定 字符 b 作为 type 的 一 部 分 实际 上 并 无 作用 。 

对 于 fdopen，type 参数 的 意义 稍 有 区 别 。 因 为 该 描述 符 已 被 打开 ， 所 以 fdopen 为 写 而 打开 并 
不 截断 该 文件 。( 例 如 , 若 该 描述 符 原来 是 由 open 函数 创建 的 , 而 且 该 文件 已 经 存在 , 则 其 O_TRUNC 
标志 将 决定 是 否 截 断 该 文件 。fdcpen 函数 不 能 截断 它 为 号 而 打开 的 任 一 文件 。) 另外 ,标准 VO 追加 
写 方式 也 不 能 用 于 创建 该 文件 〈 因 为 如 果 一 个 描述 符 引 用 一 个 文件 ， 则 该 文件 一 定 已 经 存在 )。 

当 用 追加 写 类 型 打开 一 个 文件 后 ， 每 次 写 都 将 数据 写 到 文件 的 当前 尾 端 处 。 如 果 有 多 个 进程 
用 标准 VO 追加 写 方式 打开 同一 文件 ， 那 么 来 自 每 个 进程 的 数据 都 将 正确 地 写 到 文件 中 。 


4.4BSD 以 前 的 伯克利 版 本 以 及 Kermnighan 和 Ritchie[1988] 第 177 页 上 所 示 的 简单 版 本 的 fopen & 
数 并 不 能 正确 地 处 理 追加 写 方 式 。 这 些 版 本 在 打开 流 时 ,调用 lseek 定位 到 文件 尾 端 。 在 涉及 多 个 进程 
时 ， 为 了 正确 地 支持 追加 写 方式 ， 该 文件 必须 用 0O_APPEND 标志 打开 ， 我 们 已 在 33 节 中 对 此 进行 了 讨 
论 。 在 每 次 写 前 ， 做 一 次 lseek 操作 同样 也 不 能 正确 工作 ( 如同 在 3.11 节 中 讨论 的 一 样 )。 


当 以 读 和 写 类 型 打开 一 个 文件 时 (type 中 + 号 )， 具 有 下 列 限制 。 

e 如 果 中 间 没 有 fflush, fseek, fsetpos 或 ewind,， 则 在 输出 的 后 面 不 能 直接 女 随 输入 。 

e 如 果 中 间 没 有 fseek, fsetpos 或 rewind， 或 者 一 个 输入 操作 没有 到 达 文 件 尾 端 ， 则 
在 输入 操作 之 后 不 能 直接 跟随 输出 。 

对 应 于 图 5-2， 图 5-3 中 列 出 了 打开 一 个 流 的 6 种 不 同 的 方式 。 






ea 
放弃 文件 区 前 的 内 容 

流 可 以 读 

Se lll 
流 只 可 在 尾 端 处 写 


图 5-3 打开 一 个 标准 VO 流 的 6 种 不 同方 式 
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注意 ， 在 指定 w 或 a 类 型 创建 一 个 新 文件 时 ， 我 们 无 法 说 明 该 文件 的 访问 权限 位 (第 3 章 中 所 
述 的 open 函数 和 creat 函数 则 能 做 到 这 一 点 ).POSIX.1 要 求实 现 使 用 如 下 的 权限 位 集 来 创建 文件 ， 


S_IRUSR | S IWUSR | S IRGRP | S_IWGRP | S IROTH | S IWOTH 


回忆 4.8 节 ， 我 们 可 以 通过 调整 umask 值 来 限制 这 些 权限 。 
除非 流 引 用 终端 设备 ， 否 则 按 系统 默认 ， 流 被 打开 时 是 全 缓冲 的 。 若 流 引用 终端 设备 ， 则 该 
流 是 行 缓冲 的 。 一 旦 打开 了 流 ， 那 么 在 对 该 流 执 行 任何 操作 之 前 ， 如 果 希 望 ， 则 可 使 用 前 节 所 述 
的 setbuf 和 setvbuf 改变 缓冲 的 类 型 。 
调用 fclose 关闭 一 个 打开 的 流 。 


Kfinclude <stdio.h> 


int fclose(FILE *fp); 





返回 值 : SB. X [nl 0; 若 出 错 ， 返回 EOF 


在 该 文件 被 关闭 之 前 ， 冲 洗 缓冲 中 的 输出 数据 。 组 神 区 中 的 任何 输入 数据 被 丢弃 。 如 果 标 准 
LO 库 已 经 为 该 流 自 动 分 配 了 一 个 缓冲 区 ， 则 释放 此 缓冲 区 。 

当 一 个 进程 正常 终止 时 (直接 调用 exit 函数 ， 或 从 main 函数 返回 )， 则 所 有 带 未 写 缓冲 数 
据 的 标准 VO 流 都 被 冲洗 ， 所 有 打开 的 标准 VO 流 都 被 关闭 。 


5.6 BMSH 


一 旦 打开 了 流 ， 则 可 在 3 种 不 同类 型 的 非 格式 化 VO 中 进行 选择 ， 对 其 进行 读 、 写 操作 。 

(1) 每 次 一 个 字符 的 LO。 一 次 读 或 写 一 个 字符 ， 如 果 流 是 带 缓冲 的 ， 则 标准 IO 消 数 处 理 所 有 缓冲 。 

(2) 每 次 一 行 的 VO。 如 果 想 要 一 次 读 或 写 一 行 ， 则 使 用 fgets 和 fputs。 每 行 都 以 一 个 换 
行 符 终止 。 当 调用 fgets 时 ， 应 说 明 能 处 理 的 最 大 行 长 。5.7 节 将 说 明 这 两 个 函数 。 

(3) 直接 VO. fread 和 fwrite 图 数 支持 这 种 类 型 的 IO。 每 次 IO 操作 读 或 写 某 种 数量 的 
对 象 ， 而 每 个 对 象 具 有 指定 的 长 度 。 这 两 个 函数 常用 于 从 二 进 制 文件 中 每 次 读 或 写 一 个 结构 。5.9 
节 将 说 明 这 两 个 函数 。 

直接 VO (direct VO) 这 个 术语 来 自 ISO C 标准 ， 有 时 也 被 称 为 : 二 进 制 IJO、 一 次 一 个 对 象 
; IO、 面 向 记录 的 VO 或 面向 结构 的 1O。 不 要 把 这 个 特性 和 FreeBSD 和 Linux 支持 的 open 函数 
| 的 o DIRECT 标志 混 清 ， 它 们 之 间 是 没有 关系 的 。 

(5.11 节 说 明了 格式 化 UO 函数 ， 如 printf 和 scanf.) 

1. 输入 函数 

以 下 3 个 函数 可 用 于 一 次 读 一 个 字符 。 

#include «stdio.h» 


int getc(FILE *fp); 


int fgetc(FILE *fp); 


int getchar(void); 





3 个 函数 的 返回 值 ， 若 成 功 ， 返 回 下 一 个 字符 ， 着 已 到 达 文 件 尾 端 或 出 错 ， 返 回 BOF 
函数 getchar 等 同 于 getc (stdin) 。 前 两 个 函数 的 区 别 是 ，getc 可 被 实现 为 宏 ， 而 fgetc 
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不 能 实现 为 宏 。 这 意味 着 以 下 几 点 。 

(D getc 的 参数 不 应 当 是 具有 副作用 的 表达 式 ， 因 为 它 可 能 会 被 计算 多 次 。 

(2) 因为 Egetc 一 定 是 个 函数 ， 所 以 可 以 得 到 其 地 址 。 这 就 允许 将 fgetc 的 地 址 作为 一 个 
参数 传送 给 另 一 个 函数 。 

(3) 调用 fgetc 所 需 时 间 很 可 能 比 调用 getc 要 长 ， 因 为 调用 函数 所 需 的 时 间 通 常 长 于 调用 宏 。 

这 3 个 函数 在 返回 下 一 个 字符 时 ， 将 其 unsigned char 类 型 转换 为 int 类 型 。 说 明 为 无 
符号 的 理由 是 ， 如 果 最 高 位 为 1 也 不 会 使 返回 值 为 负 。 要 求 整 型 返回 值 的 理由 是 ， 这 样 就 可 以 返 
回 所 有 可 能 的 字符 值 再 加 上 一 个 已 出 错 或 已 到 达 文 件 尾 端的 指示 值 . 在 <stdioc.h> 中 的 常量 EOF 
被 要 求 是 一 个 负 值 ， 其 值 经 常 是 -1。 这 就 意味 着 不 能 将 这 3 个 函数 的 返回 值 存放 在 一 个 字符 变量 
中 ， 以 后 还 要 将 这 些 函 数 的 返回 值 与 常量 EOF 比较 。 

注意 ， 不 管 是 出 错 还 是 到 达 文 件 尾 端 ， 这 3 个 函数 都 返回 同样 的 值 。 为 了 区 分 这 两 种 不 同 的 
情况 ， 必 须 调用 ferror E feof. 


#include «stdio.h» 


int ferror(FILE *fp); 


int feof(FILE */p): 
两 个 函数 返回 值 ， 若 条 件 为 真 ， 返 回 非 0( 真 ); 否则 ， 返 回 0 CR 





void clearerr(FILE *fp); 


在 大 多 数 实现 中 ， 为 每 个 流 在 FILE 对 象 中 维护 了 两 个 标志 ， 

e 出 错 标志 ; 

e 文件 结束 标志 。 

调用 clearerr 可 以 清除 这 两 个 标志 。 

从 流 中 读 取 数据 以 后 ， 可 以 调用 ungetc 将 字符 再 压 送 回流 中 。 


#include <stdio.h> 


int ungetc(int c, FILE *fp); 





返回 值 ; BR, 返回 C; Au. 返回 EOF 


压 送 回 到 流 中 的 字符 以 后 又 可 从 流 中 读 出 ， 但 读 出 字符 的 顺序 与 压 送 回 的 顺序 相反 。 应 当 了 
解 ， 虽 然 ISO C 允许 实现 支持 任何 次 数 的 回 送 ， 但 是 它 要 求实 现 提供 一 次 只 回 送 一 个 字符 。 我 们 
不 能 期 望 一 次 能 回 送 多 个 字符 。 

回 送 的 字符 , 不 一 定 必 须 是 上 一 次 读 到 的 字符 。 不 能 回 送 EOF。 但 是 当 已 经 到 达 文 件 尾 端 时 ， 
仍 可 以 回 送 一 个 字符 。 下 次 读 将 返回 该 字符 ， 再 读 则 返回 BoF。 之 所 以 能 这 样 做 的 原因 是 ， 一 次 
成 功 的 ungetc 调用 会 清除 该 流 的 文件 结束 标志 。 

当 正 在 读 一 个 输入 流 , 并 进行 某 种 形式 的 切 词 或 记号 切 分 操作 时 , 会 经 常用 到 回 送 字符 操作 。 
有 时 需要 先 看 一 看 下 一 个 字符 ， 以 决定 如 何 处 理 当前 字符 。 然 后 就 需要 方便 地 将 刚 查 看 的 字符 回 
送 ， 以 便 下 一 次 调用 gete 时 返回 该 字符 。 如 果 标 准 LO 库 不 提供 回 送 能 力 ， 就 需 将 该 字符 存放 
到 一 个 我 们 自己 的 变量 中 ， 并 设置 一 个 标志 以 便 判 别 在 下 一 次 需要 一 个 字符 时 是 调用 gete, & 
是 从 我 们 自己 的 变量 中 取 用 这 个 字符 。 

用 ungetc 压 送 回 字符 时 , 并 没有 将 它们 写 到 底层 文件 中 或 设备 上 , 只 是 将 它们 写 回 标准 VO 
BSEC, 
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2， 输 出 函数 
对 应 于 上 面 所 述 的 每 个 输入 函数 都 有 一 个 输出 函数 。 


#include <stdio.h> 


int putc(int c, FILE *fp); 


int fputc(int c, FILE *fp): 


int putchar(int c); 





与 输入 函数 一 样 , putchar (0) 等 同 于 putc(c，stdout), pute 可 被 实现 为 宏 , 而 fputc 
不 能 实现 为 宏 。 


5.7 每 次 一 行 |/O 


下 面 两 个 函数 提供 每 次 输入 一 行 的 功能 。 
#include <stdio.h> 
char *fgets(char *restrict buf, int m, FILE *restrict fp); 


char *gets(char *buf); 


两 个 函数 返回 值 : FRH, AE buf HOBART, RE NULL 





这 两 个 函数 都 指定 了 缓冲 区 的 地 址 ， 读 入 的 行将 送 入 其 中 。gets 从 标准 输入 读 ， 而 fgets 
则 从 指定 的 流 读 。 
对 于 fgets， 必 须 指定 缓冲 的 长 度 nx。 此 函数 一 直 读 到 下 一 个 换行 符 为 止 ， 但 是 不 超过 ml 
个 字符 ， 读 入 的 字符 被 送 入 缓冲 区 。 该 缓冲 区 以 null 字 节 结尾 。 如 车 该 行 包 括 最 后 一 个 换行 符 的 
字符 数 超 过 n-1, WW fgets 只 返回 一 个 不 完整 的 行 , 但 是 , 缓冲 区 总 是 以 null 字 节 结尾 .对 fgets 
的 下 一 次 调用 会 继续 读 该 行 。 
gets 是 一 个 不 推荐 使 用 的 函数 。 其 问题 是 调用 者 在 使 用 gets 时 不 能 指定 缓冲 区 的 长 度 。 
这 样 就 可 能 造成 缓冲 区 溢出 〈 如 若 该 行 长 于 缓冲 区 长 度 )， 写 到 缓冲 区 之 后 的 存储 空间 中 ， 从 而 
产生 不 可 预料 的 后 果 。 这 种 缺陷 曾 被 利用 ， 造 成 1988 年 的 因特网 蠕虫 事件 。 有 关 说 明 请 见 1989 
年 6 月 的 Communications of the ACM (vol.32, no.6). gets 与 fgets 的 另 一 个 区 别 是 ，gets 并 
不 将 换行 符 存 入 缓冲 区 中 。 
”这 两 个 函数 对 换行 符 处 理 方式 的 差别 与 UNIX 的 进展 有 关 。 在 V7 的 手册 (1979) 中 就 说 明 ; 
"ATHERE, gets 删除 换行 竺 ， 而 fgets 则 保留 换行 竺 。 


虽然 ISO C 要 求 提供 gets， 但 请 使 用 fgets， 而 不 要 使 用 gets。 事 实 上， 在 SUSv4 中 ， 
gets 被 标记 为 弃 用 的 接口 ， 而 且 在 ISO C 标准 的 最 新 版 本 (ISO/IEC 9899:2011) 中 已 被 忽略 。 
fputs 和 puts 提供 每 次 输出 一 行 的 功能 。 


#include <stdio.h> 


int fputs(const char *restrict sir, FILE *restrict fp); 


int puts(const char *str); 


两 个 函数 返回 值 ， 若 成 功 ， 返 回 非 负 值 ; 若 出 错 ， 返 回 EOF 
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函数 fputs 将 一 个 以 null 字 节 终止 的 字符 串 写 到 指定 的 流 ， 尾 端的 终止 符 null 不 写 出 。 注 
意 ， 这 并 不 一 定 是 每 次 输出 一 行 ， 因 为 字符 串 不 需要 换行 符 作为 最 后 一 个 非 null 字 节 。 通 常 ， 在 
null 字 节 之 前 是 一 个 换行 符 ， 但 并 不 要 求 总 是 如 此 。 

puts 将 一 个 以 null 字 节 终止 的 字符 串 写 到 标准 输出 ,终止 符 不 写 出 。 但 是 ，puts 随后 又 将 
一 个 换行 符 写 到 标准 输出 。 

puts 并 不 像 它 所 对 应 的 gets 那样 不 安全 。 但 是 我 们 还 是 应 避免 使 用 它 ， 以 免 需要 记 住 它 
在 最 后 是 否 添加 了 一 个 换行 符 。 如 果 总 是 使 用 fgets 和 fputs, 那么 就 会 熟知 在 每 行 终止 处 我 
们 必须 自己 处 理 换行 符 。 


5.8 标准 I/O 的 效率 


使 用 前 面 所 述 的 函数 ， 我 们 能 对 标准 VO 系统 的 效率 有 所 了 解 。 图 5-4 程序 类 似 于 图 3-4 程 
F, CEH getc 和 pute 将 标准 输入 复制 到 标准 输出 。 这 两 个 例 程 可 以 实现 为 宏 。 


#include "apue.h" 


int 
main (void) 
{ 


int c; 
while ((c = getc(stdin)) != EOF) 
if (putc(c, stdout) == EOF) 


err sys("output error"); 


if (ferror(stdin)) 
err sys("input error"); 


exit(0); 


5-4 用 getc 和 putc 将 标准 输入 复制 到 标准 输出 
可 以 用 fgetc 和 £putc 改写 该 程序 ， 这 两 个 一 定 是 函数 ， 而 不 是 宏 〈 我 们 没有 给 出 对 源 代 
码 更 改 的 细节 )。 
最 后 ， 我 们 还 编写 了 一 个 读 、 写 行 的 版 本 ， 见 图 5-5。 


#include "apue.h" 


int 
main (void) 
{ 
char buf [MAXLINE] ; 


while (fgets(buf, MAXLINE, stdin) !- NULL) 
if (fputs(buf, stdout) == EOF) 
err sys("output error"); 


if (ferror(stdin)) 
err sys("input error"); 
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exit(0); 


5-5 Fi fgets 和 fputs 将 标准 输入 复制 到 标准 输出 
注意 , 在 图 5-4 程序 和 图 5-5 程序 中 , 没有 显 式 地 关闭 标准 VO 流 。 我 们 知道 exit 函数 将 会 
冲洗 任何 未 写 的 数据 ， 然 后 关闭 所 有 打开 的 流 【 我 们 将 在 8.5 节 讨 论 这 一 点 )。 将 这 3 个 程序 的 时 
间 与 图 3-6 中 的 时 间 进 行 比较 是 很 有 趣 的 。 图 5-6 中 显示 了 对 同一 文件 (98.5 MB, 300 万 行 ) 进 
行 操作 所 得 的 数据 。 


3-6 中 的 最 佳 时 间 
fgets. fputs 


getc. pute 
fgetc. fputc 
图 3-6 中 的 单字 节 时 间 





5-6 ”使 用 标准 VO 例 程 得 到 的 时 间 结 果 
对 于 这 3 个 标准 IO 版 本 的 每 一 个 ， 其 用 户 CPU 时 间 都 大 于 图 3-6 中 的 最 佳 read 版 本 ， 因 
为 在 每 次 读 一 个 字符 的 标准 VO 版 本 中 有 一 个 要 执行 1 亿 次 的 循环 ， 而 在 每 次 读 一 行 的 版 本 中 有 
一 个 要 执行 3 144 984 次 的 循环 。 在 read 版 本 中 ， 其 循环 只 需 执行 25 224 次 〈 对 于 缓 神 区 长 度 
为 4096 字 节 )。 因 为 系统 CPU 时 间 几 乎 相同 ， 所 以 用 户 CPU 时 间 的 差别 以 及 等 待 VO 结束 所 消 
耗 时 间 的 差别 造成 了 时 钟 时 间 的 差别 。 
系统 CPU 时 间 几 乎 相同 , 原因 是 因为 所 有 这 些 程 序 对 内 核 提 出 的 读 、 写 请 求 数 基本 相同 。 注 
意 ， 使 用 标准 IO 例 程 的 一 个 优点 是 无 需 考虑 缓冲 及 最 佳 VO 长 度 的 选择 。 在 使 用 fgets 时 需要 
考虑 最 大 行 长 ， 但 是 与 选择 最 佳 WO 长 度 比 较 ， 这 要 方便 得 多 。 
图 5-6 的 最 后 一 列 是 每 个 main 函数 的 文本 空间 字 节 数 (由 C 编译 器 产生 的 机 器 指令 )。 从 中 
可 见 , EH gete 和 pute 的 版 本 与 使 用 fgetc 和 fputc 的 版 本 在 文本 空间 长 度 方面 大 体 相 辣 。 
通常 ，getc 和 pute 实现 为 宏 ， 但 在 GNU C 库 实现 中 ， 宏 简单 地 扩充 为 函数 调用 。 
使 用 每 次 一 行 VO 版 本 的 速度 大 约 是 每 次 一 个 字符 版 本 速度 的 两 倍 。 如 果 fgets 和 fputs 
函数 是 用 gete 和 putc 实现 的 (参见 Kernighan 和 Ritchie[1988] 的 7.7 节 )， 那 么 ， 可 以 预期 fgets 
版 本 的 时 间 会 与 gete 版 本 接近 。 实 际 上 ， 每 次 一 行 的 版 本 会 更 惕 一 些 ， 因 为 除了 现 已 存在 的 6 
百 万 次 函数 调用 外 还 需 另 外 增加 2 RA. MEA MAPA KT RRA 
memccpy(3) 实 现 的 。 通 常 ， 为 了 提高 效率 ，memccpy 函数 用 汇编 语言 而 非 C 语言 编写 。 正 因为 
如 此 ， 每 次 一 行 版 本 才 会 有 较 高 的 速度 。 
这 些 时 间 数 字 的 最 后 一 个 有 趣 之 处 在 于 : fgetc MERA 3-6 中 BUFFSIZE=1 的 版 本 要 快 
得 多 。 两 者 都 使 用 了 约 2 亿 次 的 函数 调用 ， 在 用 户 CPU 时 间 方 面 ，fgetc 版 本 的 速度 大 约 是 后 
者 的 16 倍 ， 而 在 时 钟 时 间 方 面 几乎 是 39 倍 。 造 成 这 种 差别 的 原因 是 ;使 用 read 的 版 本 执行 了 
2 亿 次 函数 调用 ， 这 也 就 引起 2 亿 次 系统 调用 。 而 对 于 fgetc 版 本 ， 它 也 执行 2 亿 次 函数 调用 ， 
但 是 这 只 引起 25 224 次 系统 调用 。 系 统 调用 与 普通 的 函数 调用 相 比 需要 花费 更 多 的 时 间 。 
5i 需要 声明 的 是 , 这 些 时 间 结 果 只 在 某 些 系统 上 才 有 效 。 这 种 时 间 结 果 依赖 于 很 多 实现 的 特征 ， 
而 这 种 特征 对 于 不 同 的 UNIX 系统 可 能 是 不 同 的 。 尽 管 如 此 ， 有 这 样 一 组 数据 ， 并 对 各 种 版 本 的 
155] 差别 做 出 解释 ， 这 有 助 于 我 们 更 好 地 了 解 系统 。 在 本 节 及 3.9 节 中 我 们 了 解 到 的 基本 事实 是 ， 标 
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准 VO 库 与 直接 调用 read 和 write 函数 相 比 并 不 慢 很 多 。 对 于 大 多 数 比较 复杂 的 应 用 程序 ， 最 
主要 的 用 户 CPU 时 间 是 由 应 用 本 身 的 各 种 处 理 消耗 的 ， 而 不 是 由 标准 IO 例 程 消耗 的 。 


5.9 ”二进制 |/O 


5.6 节 和 5.7 节 中 的 函数 以 一 次 一 个 字符 或 一 次 一 行 的 方式 进行 操作 。 如 果 进 行 二 进 制 UO 操 
作 ， 那 么 我 们 更 愿意 一 次 读 或 写 一 个 完整 的 结构 。 如 果 使 用 gete 或 putc 读 、 写 一 个 结构 ， 那 
么 必须 循环 通过 整个 结构 ， 每 次 循环 处 理 一 个 字 节 ， 一 次 读 或 写 一 个 字 节 ， 这 会 非常 麻烦 而 且 费 
时 。 如 果 使 用 fputs Al fgets, 那么 因为 fputs 在 遇 到 null 字 节 时 就 停止 ， 而 在 结构 中 可 能 含 
fj null 字 节 ， 所 以 不 能 使 用 它 实现 读 结 构 的 要 求 。 相 类 似 ， 如 果 输 入 数据 中 包含 有 null 字 节 或 换 
行 符 ， 则 fgets 也 不 能 正确 工作 。 因 此 ， 提 供 了 下 列 两 个 函数 以 执行 二 进 制 UO 操作 。 


#include <stdio.h> 


size t fread(void *restrict pir, size_t size, size t nmobj, FILE *restrict fp); 


size_t fwrite(const void *restrict pir, size t size, size t nobj, FILE *restrict fp); 


两 个 函数 的 返回 值 ， 读 或 写 的 对 象 数 





这 些 函数 有 以 下 两 种 常见 的 用 法 。 

(1) 读 或 号 一 个 二 进 制 数组 。 例 如 ， 为 了 将 一 个 浮 点 数组 的 第 2 一 5 个 元 素 写 至 一 文件 上 ， 
可 以 编写 如 下 程序 : 

float  data[10]; 


if (fwrite(&data[2], sizeof(float), 4, fp) !- 4) 
err sys("fwrite error"); 


其 中 ， 指 定 size 为 每 个 数组 元 素 的 长 度 ，nobj 为 欲 写 的 元 素 个 数 。 
(2) 读 或 写 一 个 结构 。 例 如 ， 可 以 编写 如 下 程序 ; 


struct { 
short count; 
long total; 
char name [NAMESIZE]; 
) item; 
if (fwrite(&item, sizeof(item), 1, fp) != 1) 


err sys("fwrite error"); 


其 中 ， 指 定 size 为 结构 的 长 度 ，nobi 为 1〈 要 写 的 对 象 个 数 )。 

将 这 两 个 例子 结合 起 来 就 可 读 或 写 一 个 结构 数组 。 为 了 做 到 这 一 点 ，size 应 当 是 该 结构 的 
sizeof, nobj 应 是 该 数组 中 的 元 素 个 数 。 

fread Al fwrite 返回 读 或 写 的 对 象 数 。 对 于 读 ， 如 果 出 错 或 到 达 文 件 尾 端 ， 则 此 数字 可 以 
少 于 nobj。 在 这 种 情况 ， 应 调用 ferror 或 feof 以 判断 究竟 是 那 一 种 情况 。 对 于 写 ， 如 果 返 回 
值 少 于 所 要 求 的 nobj， 则 出 错 。 

使 用 二 进 制 VO 的 基本 问题 是 ， 它 只 能 用 于 读 在 同一 系统 上 已 写 的 数据 。 多 年 之 前 ， 这 并 无 
问题 〈 那 时 ， 所 有 UNIX 系统 都 运行 于 PDP-11 上 )， 而 现在 ， 很 多 异 构 系 统 通过 网 络 相互 连接 起 
来 ， 而 且 ， 这 种 情况 已 经 非常 普遍 。 常 常 有 这 种 情形 ， 在 一 个 系统 上 写 的 数据 ， 要 在 另 一 个 系统 
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上 进行 处 理 。 在 这 种 环境 下 ， 这 两 个 函数 可 能 就 不 能 正常 工作 ， 其 原因 是 ; 

(OD 在 一 个 结构 中 ， 同 一 成 员 的 偏 移 量 可 能 随 编译 程序 和 系统 的 不 同 而 不 同 〈 由 于 不 同 的 对 
齐 要 求 )。 确 实 ， 某 些 编译 程序 有 一 个 选项 ， 选 择 它 的 不 同 值 ， 或 者 使 结构 中 的 各 成 员 紧 密 包 装 
《这 可 以 节省 存储 空间 ， 而 运行 性 能 则 可 能 有 所 下 降 );， 或 者 准确 对 齐 〈 以 便 在 运行 时 易于 存 取 结 
构 中 的 各 成 员 )。 这 意味 着 即使 在 同一 个 系统 上 ， 一 个 结构 的 二 进 制 存 放 方 式 也 可 能 因 编 译 程 序 
选项 的 不 同 而 不 同 。 

(2) 用 来 存储 多 字 节 整数 和 浮 点 值 的 二 进 制 格式 在 不 同 的 系统 结构 间 也 可 能 不 同 。 

在 第 16 章 讨论 套 接 字 时 ， 我 们 将 涉及 某 些 相关 问题 。 在 不 同系 统 之 间 交 换 二 进 制 数据 的 实 
际 解 决 方法 是 使 用 互 认 的 规范 格式 。 关 于 网 络 协 议 使 用 的 交换 二 进 制 数据 的 某 些 技 术 ， 请 参阅 
Rogof1993] 的 8.2 节 或 者 Stevens. Fenner 和 Rudoff[2004] 的 5.18 45. 

在 8.14 节 中 ， 我 们 将 再 回 到 fread 函数 ， 那 时 将 用 它 读 一 个 二 进 制 结构 
会 计 记 录 。 


5.10 ”定位 流 


有 3 种 方法 定位 标准 VO 流 。 

(D ftell 和 fseek 函数 。 这 两 个 函数 自 V7 以 来 就 存在 了 ， 但 是 它们 都 假定 文件 的 位 置 
可 以 存放 在 一 个 长 整 型 中 。 

(2) ftello 和 fseeko MA. Single UNIX Specification 引入 了 这 两 个 函数 ， 使 文件 偏 移 量 
可 以 不 必 一 定 使 用 长 整 型 。 它 们 使 用 off c 数据 类 型 代替 了 长 整 型 。 

(3) fgetpos 和 £setpos 畏 数 。 这 两 个 函数 是 由 ISO C 引入 的 。 它 们 使 用 一 个 抽象 数据 类 型 
fpos t 记录 文件 的 位 置 。 这 种 数据 类 型 可 以 根据 需要 定义 为 一 个 足够 大 的 数 ， 用 以 记录 文件 位 置 。 

需要 移植 到 非 UNIX 系统 上 运行 的 应 用 程序 应 当 使 用 £getpos 和 £setpos. 


#include <stdio.h> 





UNIX 的 进程 


long ftell(FILE *fp); 


BAG: 2H, BASRA: FHR, AE-L 


int fseek(FILE *fp, long offset, int whence); 


BEE: ry. lO; FHH., ge- 





void rewind(FILE */p); 


对 于 一 个 二 进 制 文件 ， 其 文件 位 置 指示 器 是 从 文件 起 始 位 置 开 始 度量 ， 并 以 字 节 为 度量 单位 
的 。ftell 用 于 二 进 制 文件 时 ， 其 返回 值 就 是 这 种 字 节 位 置 。 为 了 用 fseek 定位 一 个 二 进 制 文 


件 ， 必 须 指 定 一 个 字 节 ofset， 以 及 解释 这 种 偏 移 量 的 方式 。whence 的 值 与 3.6 节 中 Iseek 函数 的 


相同 SEEK SET 表示 从 文件 的 起 始 位 置 开始 ，SEEK_CUR 表示 从 当前 文件 位 置 开 始 , SEEK_END 
表示 从 文件 的 尾 端 开始 。ISO C 并 不 要 求 一 个 实现 对 二 进 制 文件 支持 SEEK_END 规格 说 明 ， 其 原 
因 是 某 些 系统 要 求 二 进 制 文件 的 长 度 是 某 个 幻 数 的 整数 倍 ， 结 尾 非 实际 内 容 部 分 则 填充 为 0。 但 
RE UNIX 中 ， 对 于 二 进 制 文件 ， 则 是 支持 SEEK_END 的 。 

对 于 文本 文件 ， 它 们 的 文件 当前 位 置 可 能 不 以 简单 的 字 节 偏 移 量 来 度量 。 这 主要 也 是 在 非 
UNIX 系统 中 ， 它 们 可 能 以 不 同 的 格式 存放 文本 文件 。 为 了 定位 一 个 文本 文件 ，whence 一 定 要 是 
SEEK_SET， 而 且 offset 只 能 有 两 种 值 ， 0 后 退 到 文件 的 起 始 位 置 )， 或 是 对 该 文件 的 ftell 所 
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返回 的 值 。 使 用 rewind 函数 也 可 将 一 个 流 设置 到 文件 的 起 始 位 置 。 
除了 偏 移 量 的 类 型 是 off 七 而 非 long 以 外 ，ftello HR ftell 相同 ，fseeko 函数 
与 fseek 相同 。 


#include <stdio.h> 


off t ftello(FILE *fp); 


返回 值 : 车 成 功 ， 返 回 当前 文件 位 置 ; 若 出 错 ， 返 回 (oft t)-1 
int fseeko(FILE *fp, off t offset, int whence); 





返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
回忆 3.6 节 中 对 otf t 数据 类 型 的 讨论 。 实 现 可 将 off_t 类 型 定义 为 长 于 32 位 。 
正如 我 们 已 提 及 的 ，fgetpos 和 fsetpos 两 个 函数 是 ISO C 标准 引入 的 。 

#include <stdio.h> 
int fgetpos{FILE *restrict fp, fpos_t *restrict pos); 
int fsetpos(FILE *fp, const fpos t *pos); 
两 个 函数 返回 值 : RT. RE 0 若 出 错 ， 返 回 非 0 
fgetpos 将 文件 位 置 指示 器 的 当前 值 存 入 由 pos 指向 的 对 和 象 中 。 在 以 后 调用 fsetpos 时 ， 
可 以 使 用 此 值 将 流 重新 定位 至 该 位 置 。 


5.11 格式 化 1/O 


1. 格式 化 输出 
格式 化 输出 是 由 5 个 printf 函数 来 处 理 的 。 


#include <stdio.h> 





int printf(const char *restrict format, ...); 
int fprintf (FILE *restrict fp, const char *restrict format, ...): 
int dprintf(int fa, const char *restrict format, ...); 
3 PRAGA: FRH, BERNAS: Sii HE. RE 
int sprintf(char *restrict buf, const char *restrict format, ...); 


BE: 若 成 功 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 


int snprintf(char *restrict buf, size t m, const char *restrict format, ...); 


返回 值 : 若 缓冲 区 足够 大 ， 返 回 将 要 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 





printf 将 格式 化 数据 写 到 标准 输出 ，fprintf 写 至 指定 的 流 ，dprintf 写 至 指定 的 文件 
HRR., sprintf 将 格式 化 的 字符 送 入 数组 buf 中 。sprintf 在 该 数组 的 尾 端 自动 加 一 个 null 
字 节 ， 但 该 字符 不 包括 在 返回 值 中 。 

注意 ，sprintf 函数 可 能 会 造成 由 buf 指向 的 缓冲 区 的 溢出。 调用 者 有 责任 确保 该 缓冲 区 足 
够 大 。 因 为 缓冲 区 溢出 会 造成 程序 不 稳定 甚至 安全 隐患 ， 为 了 解决 这 种 缓冲 区 溢出 问题 ， 引 入 了 
snprintf 函数 。 在 该 函数 中 ， 缓 冲 区 长 度 是 一 个 显 式 参数 ， 超 过 缓冲 区 尾 端 写 的 所 有 字符 都 被 
丢弃 。 如 果 缓 冲 区 足够 大 ，snprintf 函数 就 会 返回 写 入 缓冲 区 的 字符 数 。 与 sprintf 相同 ， 
该 返回 值 不 包括 结尾 的 null FH. 若 snprintf 函数 返回 小 于 缓冲 区 长 度 n WEH, WAAR 
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断 输 出 。 若 发 生 了 一 个 编码 的 错误 ，snprintf 返回 负 值 。 
虽然 dprintf 不 处 理 文件 指针 ， 但 我 们 仍然 把 它 包 括 在 处 理 格式 化 输出 的 函数 中 。 注 意 ， 
使 用 dprintf 不 需要 调用 fdopen 将 文件 描述 符 转换 为 文件 指针 (fprintf RE), 
格式 说 明 控制 其 余 参 数 如 何 编写 ， 以 后 又 如 何 显示 。 每 个 参数 按照 转换 说 明 编 写 ， 转 换 说 明 
以 百 分 号 % 开 始 ， 除 转换 说 明 外 ,格式 字符 串 中 的 其 他 字符 将 按 原样 ， 不 经 任何 修改 被 复制 输出 。 
一 个 转换 说 明 有 4 个 可 选择 的 部 分 ， 下 面 将 它们 都 示 于 方 插 号 中 : 


%[flags] [fldwidth] [precision] [lenmodifier]convtype 


图 5-7 总 结 了 各 种 标志 。 


GE SO 将 整数 按 千 位 分 组 字符 
在 字段 内 左 对 齐 输 出 


总 是 显示 带 符号 转换 的 正 负 号 
如 果 第 一 个 字符 不 是 正 负 号 ， 则 在 其 前 面 加 上 一 个 空格 
指定 另 一 种 转换 形式 《例如 ， 对 于 十 六 进 制 格式 ， 加 0x NA 
湛 加 前 导 0 而 非 空格 》 进 行 填 充 

图 5-7 转换 说 明 中 的 标志 部 分 

fldwidth 说 明 最 小 字段 宽度 。 转换 后 参数 字符 数 若 小 于 宽度 , 则 多 余 字 符 位 置 用 空格 填充 。 
字段 宽度 是 一 个 非 负 十 进 制 数 ， 或 是 一 个 星 号 〔(* )。 

Precision 说 明 整 型 转换 后 最 少 输出 数字 位 数 、 浮 点 数 转 换 后 小 数 点 后 的 最 少 位 数 、 
字符 串 转 换 后 最 大 字 节 数 。 精 度 是 一 个 点 《. )， 其 后 跟随 一 个 可 选 的 非 负 十 进 制 数 或 一 个 星 
5 (*). 

宽度 和 精度 字段 丙 者 皆 可 为 *。 此 时 ， 一 个 整 型 参数 指定 宽度 或 精度 的 值 。 该 整 型 参数 正好 
位 于 被 转换 的 参数 之 前 。 

lenmodifier 说 明 参 数 长 度 。 其 可 能 的 值 示 于 图 5-8 中 。 





将 相应 的 参数 撤 signed unsigned char 类 型 输出 
将 相应 的 参数 按 signed BE unsigned short 类 型 输出 
将 相应 的 参数 按 signed 或 unsigned Long 或 宽 字符 类 型 输出 


将 相应 的 参数 按 signed 或 unsigned long long 类 型 输出 
intmax t 或 uintmax. 上 七 

size t 

ptrdiff t 

long double 





图 5-8 ”转换 说 明 中 的 长 度 修饰 符 
convtype 不 是 可 选 的 。 它 控制 如 何 解释 参数 。 图 5-9 中 列 出 了 各 种 转换 类 型 字符 。 
根据 常规 的 转换 说 明 ， 转 换 是 按照 它们 出 现在 format 参数 之 后 的 顺序 应 用 于 参数 的 。 一 
种 替代 的 转换 说 明 语 法 也 允许 显 式 地 用 %n3$ 序 列 来 表示 第 个 参数 的 形式 来 命名 参数 。 注 意 ， 
这 两 种 语法 不 能 在 同一 格式 说 明 中 混用 。 在 替代 的 语法 中 ， 参 数 从 1 开始 计数 。 如 果 参 数 既 
没有 提供 字段 宽度 和 也 没有 提供 精度 ， 通配符 星 号 的 语法 就 更 改 为 *w3，m 指明 提供 值 的 参数 
的 位 置 。 
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有 符号 十 进 制 

无 符号 八进制 

无 符号 十 进 制 

无 符号 十 六 进 制 

双 精 度 浮 点 数 

指数 格式 双 精 度 浮 点 数 

根据 转换 后 的 值 解释 为 f、P、e 或 EE 


十 六 进 制 指数 格式 双 精 度 浮 点 数 

字符 〈 若 带 长 度 修饰 符 1， 为 宽 字符 ) 

字符 串 〈 若 带 长 度 修 饰 符 1， 为 宽 字 符 ) 

指向 void 的 指针 

到 目前 为 止 , 此 printf 调用 输出 的 字符 的 数目 将 被 写 入 到 
指针 所 指向 的 带 符 号 整 型 中 

一 个 s 字 符 

REE (XSI 扩展 ， 等 效 于 1c) 

REAR (XSI 扩展， 等 效 于 ls) 





图 5-9 ”转换 说 明 中 的 转换 类 型 
下 列 5 种 printf 族 的 变 体 类 似 于 上 面 的 5 种 ， 但 是 可 变 参 数 表 C...) 替换 成 了 arg。 








#include «stdarg.h» 

$include «stdio.h» 

int vprintf(const char *restrict format, va list arg); 

vfprintf(FILE *restrict fp, const char *restrict format, va list arg); 

int vdprintf(int fd, const char *restrict format, va list arg); 

所 有 3 个 函数 返回 值 : FRA. PMSA: SRM, BAR 

vsprintf(char *restrict buf, const char *restrict format, va list arg): 
函数 返回 值 ， 着 成 功 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 

int vsnprintf(char *restrict buf, size t n, const char *restrict format, va list am); 


函数 返回 值 ， 若 缓冲 区 足够 大 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 


在 附录 B 的 出 错 处 理 例 程 中 ， 将 使 用 vsnprintf AR. 

关于 ISOC 标 准 中 有 关 可 变 长 度 参 数 表 的 详细 说 明 请 参阅 Kemighan 和 Ritchie[1988] 的 7.3 节 。 
应 当 了 解 的 是 ， 由 ISO C 提供 的 可 变 长 度 参数 表 例 程 (<stdarg.h> 头 文件 和 相关 的 例 程 ) 与 由 
较 早 版 本 UNIX 提供 的 <varargs .h> 例 程 是 不 同 的 。 

2. 格式 化 输入 

执行 格式 化 输入 处 理 的 是 3 个 scanf 函数 。 


#include <stdio.h> 









int scanf(const char *restrict format, ...)? 


int fscanf(FILE *restrict fp, const char *restrict format, ...)3 


int sscanf(const char “restrict buf, const char *restrict format, ...); 


3 个 函数 返回 值 : 赋值 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 转换 前 已 到 达 文件 尾 端 ， 返 回 EOF 
scanf 族 用 于 分 析 输 入 字符 串 ， 并 将 字符 序列 转换 成 指定 类 型 的 变量 。 在 格式 之 后 的 各 参数 
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包含 了 变量 的 地 址 ， 用 转换 结果 对 这 些 变量 赋值 。 

格式 说 明 控制 如 何 转换 参数 ， 以 便 对 它们 赋值 。 转 换 说 明 以 % 字 符 开始 。 除 转换 说 明和 空白 
字符 外 ， 格 式 字符 串 中 的 其 他 字符 必须 与 输入 匹配 。 若 有 一 个 字符 不 匹配 ， 则 停止 后 续 处 理 ， 不 
再 读 输入 的 其 余部 分 。 

一 个 转换 说 明 有 3 个 可 选择 的 部 分 ， 下 面 将 它们 都 示 于 方 括号 中 : 


&(*] [fldwidth] [m] [lenmodifier] convtype 


TRKE C) 用 于 抑制 转换 。 按 照 转 换 说 明 的 其 余部 分 对 输入 进行 转换 ， 但 转换 结果 并 不 
存放 在 参数 中 。 

fldwidth 说 明 最 大 宽度 ( 即 最 大 字符 数 )。lenmodifier 说 明 要 用 转换 结果 赋值 的 参数 大 小 。 
H printf 函数 族 支持 的 长 度 修饰 符 同 样 得 到 scant 族 函数 的 支持 〈 见 图 5-8 中 的 长 度 修饰 符 表 )。 

convtype 字段 类 似 于 printf 族 的 转换 类 型 字段 ， 但 两 者 之 间 还 有 些 差别 。 一 个 差别 是 ， 
作为 一 种 选项 , 输入 中 带 符号 的 可 赋予 无 符号 类 型 。 例 如 , 输入 流 中 的 -1 可 被 转换 成 294 967 295 
赋予 无 符号 整 型 变量 。 图 5-10 总 结 了 scanf 族 函数 支持 的 转换 类 型 。 

在 字段 宽度 和 长 度 修饰 符 之 间 的 可 选项 m RH. CA UA Fic. ts ELE S [转换 符 ， 

迫使 内 存 缓冲 区 分 配 空间 以 接纳 转换 字符 串 。 在 这 种 情况 下 ， 相 关 的 参数 必须 是 指针 地 址 ， 分 配 

的 缓冲 区 地 址 必须 复制 给 该 指针 。 如 果 调 用 成 功 ， 该 缓冲 区 不 再 使 用 时 ， 由 调用 者 负责 通过 调用 
free 函数 来 释放 该 缓冲 区 。 

scanf 函数 族 同 样 支持 另外 一 种 转换 说 明 ， 人 允许 显 式 地 命名 参数 ， 序列 %n83 代 表 了 第 n 个 参 
51.55 printf 函数 族 相同 , 同一 编号 的 参数 在 格式 申 中 可 引用 多 次 .但 Single UNIX Specification 
指出 ， 这 种 情况 在 scant 通 数 族 中 如 何 作用 还 未 定义 。 


有 符号 十 进 制 ， 基 数 为 10 


i 有 符号 十 进 制 ， 基 数 由 输入 格式 决定 

o 无 符号 八进制 (输入 可 选 地 有 符号 ) 

u 无 符号 十 进 制 ， 基 数 为 10〈 输 入 可 选 地 有 符号 ) 

x. X 无 符号 十 六 进 制 〈 输 入 可 选 地 有 符号 》 
a. A. e E, f. F. g G | PAR 

FR OOKDHRHESBHEERMERD I1, AAF) 
字符 上 囊 〈 车 带 长 度 修饰 符 1， 为 宽 字 符 串 》 
匹配 列 出 的 字符 序列 ， 以 ] 终止 
匹配 除 列 出 字符 以 外 的 所 有 字符 ， 以 ] 终止 
指向 void 的 指针 
将 到 目前 为 止 该 函数 调用 读 取 的 字符 数 写 入 到 指针 所 指向 的 无 符号 整 型 中 
一 个 % 符 号 
TS (XSI 扩展， 等 效 于 1c) 
宽 字 符 串 (XSI 扩展， 等 效 于 ls) 


5-10 ”转换 说 明 中 的 转换 类 型 
与 printf 族 相 同 ，scanf 族 也 使 用 由 <stdqarg.h> 说 明 的 可 变 长 度 参数 表 。 


finclude «stdarg.h» 





$include <stdio.h> 





int vscanf(const char *restrict format, va list arg); 
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int vfscanf(FILE *restrict fp, const char *restrict format, va list arg): 





int vsscanf {const char *restrict buf, const char *restrict format, va list arg); 


3 个 函数 返回 值 ， 指 定 的 输入 项 目 数 ， 若 输入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 BOF 
关于 scant 函数 族 的 详细 情况 ， 请 参阅 UNIX 系统 手册 。 


5.12 实现 细节 


正如 前 述 ， 在 UNIX 中 ， 标 准 IO 库 最 终 都 要 调用 第 3 章 中 说 明 的 VO 例 程 。 每 个 标准 VO 
流 都 有 一 个 与 其 相关 联 的 文件 描述 符 ， 可 以 对 一 个 流 调用 fileno 函数 以 获得 其 描述 符 。 


| i£, fileno WX ISO C 标准 部 分 ， 而 是 POSIX.1 支持 的 扩展 。 


#include <stdio.h> 


int fileno(FILE *fp); 





返回 值 : 与 该 流 相 关联 的 文件 描述 符 


如 果 要 调用 dup 或 fcnt1l 等 函数 ， 则 需要 此 函数 。 

为 了 了 解 你 所 使 用 的 系统 中 标准 IO 库 的 实现 ， 最 好 从 头 文件 <stdio.h> 开 始 。 从 中 可 以 看 到 
FILE 对 象 是 如 何 定义 的 、 每 个 流标 志 的 定义 以 及 定义 为 宏 的 各 个 标准 VO 例 程 (如 getc)。Kemighan 
和 Ritchie[1988] 中 的 8.5 节 含 有 一 个 示例 实现 ， 从 中 可 以 看 到 很 多 UNIX 实现 的 基本 样式 。Plaugerf1992] 
的 第 12 章 提供 了 标准 IO 库 一 种 实现 的 全 部 源 代码 。GNU 标准 VO 库 的 实现 也 是 公开 可 用 的 。 


a 实例 
图 5-11 程序 为 3 个 标准 流 以 及 一 个 与 普通 文件 相关 联 的 流 打印 有 关 缓 冲 的 状态 信息 。 


#include "apue.h" 


void pr stdio(const char *, FILE *); 
int is unbuffered(FILE *); 

int is linebuffered(FILE *); 

int buffer size(FILE *); 

int 


main (void) 
{ 
FILE *fp; 


fputs("enter any character\n", stdout); 
if (getchar() == EOF) 
err_sys("getchar error"); 
fputs ("one line to standard error\n", stderr); 


pr stdio("stdin", stdin); 
pr stdio("stdout", stdout); 


pr stdio("stderr", stderr); 


if ((fp = fopen("/etc/passwd", "r")) -- NULL) 
err sys("fopen error"); 
if (getc(fp) -- EOF) 
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err sys("getc error"); 
pr stdio("/etc/passwd", fp); 
exit(0): 


void 
pr stdio(const char *name, FILE *fp) 
i 
printf("stream - $s, ", name); 
if (is unbuffered(fp)) 
printf ("unbuffered"); 
else if (is_linebuffered(fp)) 
printf ("line buffered"); 
else /* if neither of above */ 
printf ("fully buffered"); 
printf(", buffer size = td\n", buffer size(fp)); 


/* 
* The following is nonportable. 
*/ 


Rif defined( IO UNBUFFERED) 


int 
is unbuffered(FILE *fp) 


{ 
return(fp-» flags & ,IO UNBUFFERED); 


int 
is linebuffered(FILE *fp) 


{ 
return(fp->_flags & _IO_LINE_BUF); 


int 
buffer_size(FILE *fp) 
{ 
return(fp-» IO buf end - fp-» IO buf base); 


#elif defined( SNBF) 


int 
is unbuffered(FILE *fp) 
( 
return(fp-» flags & , SNBF); 


int 
is linebuffered(FILE *fp) 
( 
return(fp-» flags & , SLBF); 
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int 
buffer size(FILE *fp) 
{ 
return (fp->_bf._size); 
} 


#elif defined( IONBF) 


#ifdef  LP64 

#define flag _pad[4] 
#define ptr _pad[1] 
#define base _ pad[2] 
#endif 


int 
is_unbuffered (FILE *fp) 


{ 
return(fp->_flag & _IONBF); 
) 


int 
is linebuffered (FILE *fp) 


{ 
return(fp->_flag & _IOLBF); 


} 


int 
buffer_size(FILE *fp) 
{ 
#ifdef  LP64 
return (fp->_base - fp->_ptr); 
#else 
return(BUFSIZ);  /* just a guess */ 
dendif 
) 


felse 
#error unknown stdio implementation! 


#endif 
图 5-11 对 各 个 标准 VO 流 打印 缓冲 状态 信息 

注意 ， 在 打印 缓冲 状态 信息 之 前 ， 先 对 每 个 流 执 行 VO 操作 ， 第 一 个 VO 操作 通常 就 造成 为 
该 流 分 配 缓冲 区 。 本 例 中 的 结构 成 员 和 常量 是 由 本 书 中 使 用 的 4 种 平台 实现 的 标准 IO 库 定义 的 。[166] 
应 当 了 解 ， 标 准 IO 库 实现 在 不 同 的 系统 中 可 能 有 所 不 同 ， 像 本 例 中 的 程序 是 不 可 移植 的 ， 因 为 
它们 媒 入 了 与 特定 实现 相关 的 内 容 。 

如 果 运 行 图 5-11 的 程序 两 次 , 一 次 使 3 个 标准 流 与 终端 相连 接 ， 另 一 次 使 它们 重 定向 到 普通 
文件 ， 则 所 得 结果 是 : 


$ ./a.out stdin, stdout 和 stderr 都 连 至 终端 
enter any character 
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键入 换行 符 
one line to standard error 
stream - stdin, line buffered, buffer size - 1024 
stream = stdout, line buffered, buffer size = 1024 
stream = stderr, unbuffered, buffer size = 1 
stream = /etc/passwd, fully buffered, buffer size = 4096 
$ ./a.out < /atc/group > std.out 2» std.err 

3 个 流 都 重 定向 ， 再 次 运行 该 程序 
$ cat std.err 
one line to standard error 
S cat std.out 
enter any character 
stream - stdin, fully buffered, buffer size - 4096 
stream = stdout, fully buffered, buffer size = 4096 
stream = stderr, unbuffered, buffer size = 1 
stream = /etc/passwd, fully buffered, buffer size = 4096 


从 中 可 见 ， 该 系统 的 默认 是 ， 当 标准 输入 、 输 出 连 至 终端 时 ， 它 们 是 行 缓冲 的 。 行 缓冲 的 长 度 
是 1024 字 节 。 注 意 ， 这 并 没有 将 输入 、 输 出 的 行 长 限制 为 1024 字 节 ， 这 只 是 缓冲 区 的 长 度 。 如 
果 要 将 2 048 字 节 的 行 写 到 标准 输出 , 则 要 进行 两 次 write 系统 调用 。 当 将 这 两 个 流 重新 定向 到 普 
通 文件 时 ， 它 们 就 变 成 是 全 缓冲 的 ， 其 缓冲 区 长 度 是 该 文件 系统 优先 选用 的 VO KE CM stat 结 
构 中 得 到 的 st blksize 值 )。 从 中 也 可 看 到 ， 标 准 错误 如 它 所 应 该 的 那样 是 不 带 缓冲 的 ， 而 普 
通 文件 按 系统 默认 是 全 缓冲 的 。 u" 


5.13 ”临时 文件 


ISO C 标准 UO 库 提 供 了 两 个 函数 以 帮助 创建 临时 文件 。 


#include<stdio.h> 


char *tmpnam(char *pfr); 
返回 值 ， 指 向 唯一 路 径 名 的 指针 
FILE *tmpfile(void); 





返回 值 ， 若 成 功 ， 返 回 文件 指针 ， 若 出 错 ， 返 回 NULL 


tmpnam 函数 产生 一 个 与 现 有 文件 名 不 同 的 一 个 有 效 路 径 名 字符 串 。 每 次 调用 它 时 ， 都 产生 
一 个 不 同 的 路 径 名 ， 最 多 调用 次 数 是 TMP_MAX. TMP_MAX 定义 在 <stdio .h> 中 。 


虽然 ISO C 定义 了 TMP_MRX， 但 该 标准 只 要 求 其 值 至 少 应 为 25。 但 是 ，Single UNIX Specification 
却 要 求 符合 XSI 的 系统 支持 其 值 至 少 为 10 000。 虽 然 此 最 小 值 允 许 一 个 实现 使 用 4 位 数字 ( 0000 ~ 

| 9999) 作为 临时 文件 名 ， 但是， 大 多 数 UNIX 实 现 使 用 的 却 是 大 、 小 写字 符 。 

i tmpnam 函数 在 SUSv4 中 被 标记 为 齐 用 ， 但 是 ISO C 标准 还 继续 支持 它 。 


3$ ptr 是 NULL， 则 所 产生 的 路 径 名 存放 在 一 个 静态 区 中 ,指向 该 静态 区 的 指针 作为 函数 值 返 
回 。 后 续 调用 tmpnam 时 ， 会 重 写 该 静态 区 (这 意味 着 ， 如 果 我 们 调用 此 函数 多 次 ， 而 且 想 保存 
路 径 名 ， 则 我 们 应 当 保 存 该 路 径 名 的 副本 ， 而 不 是 指针 的 副本 )。 如 若 pr 不 是 NULL， 则 认为 它 
应 该 是 指向 长 度 至 少 是 L_tmpnam 个 字符 的 数组 (常量 L_tmpnam 定 义 在 头 文 件 <stdqio .h> 中 )。 
所 产生 的 路 径 名 存放 在 该 数组 中 ，ptr 也 作为 函数 值 返回 。 

tmpfile 创建 一 个 临时 二 进 制 文件 (类 型 wb+)， 在 关闭 该 文件 或 程序 结束 时 将 自动 删除 这 
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种 文件 。 注 意 ，UNIX 对 二 进 制 文件 不 进行 特殊 区 分 。 


a 实例 
5-12 程序 说 明了 这 两 个 函数 的 应 用 。 


#include "apue.h" 





int 
main(void) 
{ 
char name[L_tmpnam], line [MAXLINE]; 


FILE *fp; 
printf ("$s\n", tmpnam(NULL)); /* first temp name */ 
tmpnam (name) ; /* second temp name */ 


printf("%s\n", name); 


if ((fp = tmpfile()) == NULL) /* create temp file */ 
err sys("tmpfile error"); 
fputs("one line of output\n", fp); /* write to temp file */ 


rewind(fp); /* then read it back */ 
if (fgets(line, sizeof(line), fp) == NULL) 
err sys("fgets error"); 
fputs(line, stdout); /* print the line we wrote */ 
exit (0); 


图 5-12 tmpnam 和 tmpfile 函数 实例 
执行 图 5-12 的 程序 ， 可 得 : 


$ ./a.out 

/tmp/fileTOHsu6 

/tmp/filekmAsYQ 

one line of output " 


tmpfile 函数 经 常 使 用 的 标准 UNIX 技术 是 先 调用 tmpnam 产生 一 个 唯一 的 路 径 名 ， 然 后 ， 
用 该 路 径 名 创建 一 个 文件 ， 并 立即 unlink 它 。 请 回忆 4.15 节 ， 对 一 个 文件 解除 链接 并 不 删除 其 
内 容 ， 关 闭 该 文件 时 才 删 除 其 内 容 。 而 关闭 文件 可 以 是 显 式 的 ， 也 可 以 在 程序 终止 时 自动 进行 。 

Single UNIX Specification 为 处 理 临 时 文件 定义 了 另外 两 个 函数 : mkdtemp 和 mkstemp， 它 
们 是 XSI 的 扩展 部 分 。 


#include <stdlib.h> 


char *mkdtemp(char *template) ; 


返回 值 : 车 成 功 ， 返 回 指向 目录 名 的 指针 ;者 出 错 ， 返 回 NULL 


int mkstemp(char *femplate) ; 





返回 值 ， 若 成 功 ， 返 回 文件 描述 符 ; 若 出 错 ， 返 回 -1 


mkdtemp 函数 创建 了 一 个 目录 ， 该 目录 有 一 个 唯一 的 名 字 ; mkstemp 函数 创建 了 一 个 文件 ， 
该 文件 有 一 个 唯一 的 名 字 。 名 字 是 通过 template 字符 串 进 行 选择 的 。 这 个 字符 串 是 后 6 位 设置 为 
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XXXXXX 的 路 径 名 。 函 数 将 这 些 占 位 符 替 换 成 不 同 的 字符 来 构建 一 个 唯一 的 路 径 名 。 如 果 成 功 的 
话 ， 这 两 个 函数 将 修改 template 字符 串 反映 临时 文件 的 名 字 。 

Ei mkdtemp 函数 创建 的 目录 使 用 下 列 访问 权限 位 集 : S IRUSR | S IWUSR | S_IXUSR。 注 
意 ， 调 用 进程 的 文件 模式 创建 屏蔽 字 可 以 进一步 限制 这 些 权限 。 如 果 目 录 创 建成 功 ，mkdtemp 
返回 新 目录 的 名 字 。 

mkstemp 函数 以 唯一 的 名 字 创 建 一 个 普通 文件 并 且 打 开 该 文件 ,该 函数 返回 的 文件 描述 符 以 
读 写 方式 打开 。 由 mkstemp 创建 的 文件 使 用 访问 权限 位 S_IRUSR | S_IWUSR。 

与 tempfile 不 同 ，mkstemp 创建 的 临时 文件 并 不 会 自动 删除 。 如 果 希 望 从 文件 系统 命名 
空间 中 删除 该 文件 ， 必 须 自 己 对 它 解除 链接 ， 

使 用 tmpnam 和 tempnam 至 少 有 一 个 缺点 ;在 返回 唯一 的 路 径 名 和 用 该 名 字 创 建文 件 之 间 
存在 一 个 时 间 窗 口 ， 在 这 个 时 间 窗 口中 ， 另 一 进程 可 以 用 相同 的 名 字 创 建文 件 。 因 此 应 该 使 用 
tmpfile 和 mkstemp 函数 ， 因 为 它们 不 存在 这 个 问题 。 


m 实例 
图 5-13 程序 显示 了 如 何 使 用 mkstemp 函数 。 


f£include "apue.h" 
#include <errno.h> 


void make_temp(char *template); 


int 

main () 

{ 
char good template[] = "/tmp/dirXXXXXX"; /* right way */ 
char *bad template - "/tmp/dirXXXXXX"; /* wrong way*/ 


printf("trying to create first temp file...\n"); 
make temp (good template); 
printf ("trying to create second temp file...\n"); 
make temp (bad template); 
exit(0); 

} 


void 
make_temp(char *template) 
{ 
int fd; 
struct stat sbuf; 


if ((fd = mkstemp(template)) < 0) 
err_sys ("can't create temp file"); 
printf("temp name = %s\n", template); 
close (fd); 
if (stat (template, &sbuf) < 0) I 
if (errno == ENOENT) 
printf("file doesn't exist\n"); 
else 
err Sys("stat failed"); 
) else ( 
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printf("file exists\n"); 
unlink(template); 


5-13 mkstemp 函数 的 应 用 
运行 图 5.13 中 的 程序 ， 得 到 ; 


$ ./a.out 

trying to create first temp file... 
temp name - /tmp/dirUmBT7h 

file exists 

trying to create second temp file... 
Segmentation fault 


两 个 模板 字符 串 声 明 方 式 的 不 同 带 来 了 不 同 的 运行 结果 。 对 于 第 一 个 模板 ， 因 为 使 用 了 数组 ， 
名 字 是 在 栈 上 分 配 的 。 但 第 二 种 情况 使 用 的 是 指针 ， 在 这 种 情况 下 ， 只 有 指针 自身 驻 留 在 栈 上 。 
编译 器 把 字符 串 存 放 在 可 执行 文件 的 只 读 段 ， 当 mkstemp 函数 试图 修改 字符 串 时 ， 出 现 了 段 错 
iX (segment fault). a” 
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我 们 已 经 看 到 ， 标 准 IO 库 把 数据 缓存 在 内 存 中 ， 因 此 每 次 一 字符 和 每 次 一 行 的 VO 更 有 效 。 
我 们 也 可 以 通过 调用 setbuf 或 setvbuf 函数 让 IO 库 使 用 我 们 自己 的 缓冲 区 。 在 SUSv4 PX 
持 了 内 存 流 。 这 就 是 标准 VO 流 ， 虽 然 仍 使 用 FILE 指针 进行 访问 ， 但 其 实 并 没有 底层 文件 。 所 
有 的 Vo 都 是 通过 在 缓冲 区 与 主 存 之 间 来 回 传送 字 节 来 完成 的 。 我 们 将 看 到 ， 即 便 这 些 流 看 起 来 
像 文件 流 ， 它 们 的 某 些 特征 使 其 更 适用 于 字符 串 操作 。 

有 3 个 函数 可 用 于 内 存 流 的 创建 ， 第 一 个 是 fmemopen 函数 。 


#include «stdio.h» 


FILE *fmemopen(void *restrict buf, size t size, const char *restrict fype); 


返回 值 ， 若 成 功 ， 返 回流 指针 ; EHR, BE NULL 





fmemopen 函数 允许 调用 者 提供 缓冲 区 用 于 内 存 流 : buf 参数 指向 缓冲 区 的 开始 位 置 ，size 
参数 指定 了 缓冲 区 大 小 的 字 节 数 。 如 果 buf 参数 为 定 ，fmemopen 函数 分 配 size P Ti S ERI ZR PREX. 。 
在 这 种 情况 下 ， 当 流 关 闭 时 缓冲 区 会 被 释放 。 

type 参数 控制 如 何 使 用 流 。type 可 能 的 取 值 如 图 5-14 所 示 。 



















r € rb 为 读 而 打开 






w 或 wb 为 写 而 打开 

a Rab 追加 ; 为 在 第 一 个 null 字 节 处 写 而 打开 
rtHÉ reb 或 b+ 为 读 积 写 而 打开 
w+ 或 wtb 或 wb+ 把 文件 截断 至 0 长 ， 为 读 和 写 而 打开 
a*3X atb EX ab 追加 ， 为 在 第 一 个 null 字 节 处 读 和 写 而 打开 





5-14 ”打开 内 存 流 的 type 参数 
注意 , 这 些 取 值 对 应 于 基于 文件 的 标准 IO 流 的 type 参数 取 值 , 但 其 中 有 些微 小 差别 。 第 一 ， 


无 论 何 时 以 追加 写 方式 打开 内 存 流 时 ， 当 前 文件 位 置 设 为 缓冲 区 中 的 第 一 个 null 字 节 。 如 果 缓 冲 
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区 中 不 存在 null 字 节 ， 则 当前 位 置 就 设 为 缓冲 区 结尾 的 后 一 个 字 节 。 当 流 并 不 是 以 追加 写 方式 打 
开 时 ， 当 前 位 置 设 为 缓冲 区 的 开始 位 置 。 因 为 追加 写 模式 通过 第 一 个 null 字 节 确定 数据 的 尾 端 ， 
内 存 流 并 不 适合 存储 二 进 制 数据 (二 进 制 数 据 在 数据 尾 端 之 前 就 可 能 包含 多 个 null 字 节 )。 

第 二 ， 如 果 buf 参数 是 一 个 null 指针 ， 打 开 流 进行 读 或 者 写 都 没有 任何 意义 。 因 为 在 这 种 情 
况 下 缓冲 区 是 通过 fmemopen 进行 分 配 的 ， 没 有 办 法 找到 缓冲 区 的 地 址 ， 只 写 方式 打开 流 意味 着 
无 法 读 取 已 写 入 的 数据 ， 同 样 ， 以 读 方 式 打开 流 意味 着 只 能 读 取 那 些 我 们 无 法 写 入 的 缓冲 区 中 的 
数据 。 

第 三 ， 任 何 时 候 需 要 增加 流 缓冲 区 中 数据 量 以 及 调用 fclose, fflush. fseek, fseeko 
以 及 £setpos 时 都 会 在 当前 位 置 写 入 一 个 null 字 节 。 


DE 


有 必要 看 一 下 对 内 存 流 的 写 入 是 如 何在 我 们 自己 提供 的 缓冲 区 上 进行 操作 的 。 图 5-15 给 出 了 
用 已 知 模式 填充 缓冲 区 时 流 写 入 是 如 何 操作 的 。 


#include "apue.h" 
#define BSZ 48 


int 
mainí) 
{ 
FILE *fp; 
char buf [B82]; 


memset (buf, 'a', BSZ-2); 

buf[BSZ-2] = 'N0'; 

buf [BSZ-1]) = 'X'; 

if ((fp = fmemopen (buf, BSZ, "w*")) == NULL) 
err sys("fmemopen failed"); 

printf("initial buffer contents: %s\n", buf); 

fprintf(fp, "hello, world"); 

printf("before flush: s\n", buf); 

fflush(fp); 

printf("after fflush: $sMn", buf); 

printf("len of string in buf = *l1dWn", (long)strlen(buf)); 


memset (buf, 'b', BSZ-2); 

buf [BSZ-2] *\O'; 

buf [BSZ-1] 'X'; 

fprintf(fp, "hello, world"); 

fseek(fp, 0, SEEK SET); 

printf("after fseek: %s\n", buf); 

printf("len of string in buf = %ld\n", (long)strlen(buf)); 


memset (buf, 'c', BS2-2); 

buf [BS2-2] "\0'; 

buf [BSZ-1] 'X'!; 

fprintf(fp, "hello, world"); 

fclose (fp); 

printf ("after fclose: %s\n", buf); 

printf("len of string in buf = $1dMn", (long)strlen(buf)); 
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return(0); 





图 5-15 ”观察 内 存 流 的 写 入 操作 
我 们 在 Linux 上 运行 该 程序 ， 得 到 如 下 结果 ， 


$ ./a.out 

用 a 字符 改写 缓冲 区 
initial buffer contents: fmemopen 在 缓冲 区 开始 处 放置 nun 字 节 
before flush: 流 冲洗 后 缓冲 区 才 会 变化 
after fflush: hello, world 
len of string in buf - 12 null 字 节 加 到 字符 串 结尾 

现在 用 b 字符 改写 缓冲 区 
after fseek: bbbbbbbbbbbbhello, world fseek 引起 缓冲 区 冲洗 
len of string in buf = 24 再 次 追加 写 null 字 节 

现在 用 c 字符 改写 缓冲 区 
after fclose: hello, worldcccccccccccccccccccccccecccccccccc 
len of string in buf - 46 没有 追加 写 null 字 节 


这 个 例子 给 出 了 冲洗 内 存 流 和 追加 写 null 字 节 的 策略 。 写 入 内 存 流 以 及 推进 流 的 内 容 大 小 ( 相 
对 缓冲 区 大 小 而 言 ， 该 大 小 是 固定 的 ) 这 个 概念 时 ，mull 字 节 会 自动 追加 写 。 流 内 容 大 小 是 由 写 
入 多 少 来 确定 的 。 
在 本 书 所 讨论 的 4 个 平台 中 ， 只 有 Linux 3.2.0 支持 内 存 流 。 这 是 具体 实现 还 没有 跟 上 最 新 的 标 
“ 淮 ， 相 信 随 着 时 间 的 推移 ， 这 种 情况 会 有 所 改变 。 H 


用 于 创建 内 存 流 的 其 他 两 个 函数 分 别 是 open. memstream 和 open wmemst ream. 


#include <stdio.h> 
FILE *open memstream(char **bufp, size t *sizep); 


#include «wchar.h» 


FILE *open wmemstream(wchar t **bufp, size t *sizep); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回流 指针 ， 若 出 错 ， 返 回 NULL | [173 





open memstream 函数 创建 的 流 是 面向 字 节 的 , open. wmemstream 函数 创建 的 流 是 面向 
APPR (EHZ 5.2 节 中 对 于 多 字 节 字符 的 说 明 )。 这 两 个 函数 与 fmemopen 函数 的 不 同 在 于 : 

s 创建 的 流 只 能 写 打 开 ; 

。 不 能 指定 自己 的 缓冲 区 ， 但 可 以 分 别 通过 bufp 和 sizep 参数 访问 缓冲 区 地 址 和 大 小 ; 

。 关闭 流 后 需要 自行 释放 缓冲 区 ; 

。 对 流 添加 字 节 会 增加 缓冲 区 大 小 。 

但 是 在 缓冲 区 地 址 和 大 小 的 使 用 上 必须 遵循 一 些 原则 。 第 一 ， 缓 冲 区 地 址 和 长 度 只 有 在 调用 
fclose 或 fflush 后 才 有 效 ; 第 二 ， 这 些 值 只 有 在 下 一 次 流 写 入 或 调用 fclose 前 才 有 效 。 因 
为 缓冲 区 可 以 增长 ， 可 能 需要 重新 分 配 。 如 果 出 现 这 种 情况 ， 我 们 会 发 现 缓冲 区 的 内 存 地 址 值 在 
下 一 次 调用 fclose 或 fflush 时 会 改变 。 

因为 避免 了 缓冲 区 溢出 ， 内 存 流 非常 适用 于 创建 字符 串 。 因 为 内 存 流 只 访问 主 存 ， 不 访 
问 磁盘 上 的 文件 , 所 以 对 于 把 标准 VO 流 作 为 参数 用 于 临时 文件 的 函数 来 说 , 会 有 很 大 的 性 能 
提升 。 
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5.15 标准 I/O 的 替代 软件 


标准 VO 库 并 不 完善 。 Korn 和 Vo[1991] 列 出 了 它 的 很 多 不 足 之 处 , 其 中 , 基 些 属于 基本 设计 ， 
但 是 大 多 数 则 与 各 种 不 同 的 实现 有 关 。 

标准 IO 库 的 一 个 不 足 之 处 是 效率 不 高 ， 这 与 它 需 要 复制 的 数据 量 有 关 。 当 使 用 每 次 一 行 函 
数 fgets 和 fputs 时 ,通常 需要 复制 两 次 数据 :一 次 是 在 内 核 和 标准 VO 缓冲 区 之 间 ( 当 调用 read 
和 write 时 ) 第 二 次 是 在 标准 VO 缓冲 区 和 用 户 程序 中 的 行 缓冲 区 之 间 。 快速 VO 库 [AT&T 1990a 
中 的 fio(G3)] 避 免 了 这 一 点 ， 其 方法 是 使 读 一 行 的 函数 返回 指向 该 行 的 指针 ， 而 不 是 将 该 行 复制 到 
另 一 个 缓冲 区 中 。Hume[1988] 报 告 : 由 于 做 了 这 种 更 改 ，grep(1) 实 用 程序 的 速度 提升 了 3 倍 。 

Korn 和 Vo[1991] 说 明了 标准 VO 库 的 另 一 种 蔡 代 版 ，sfio。 这 一 软件 包 在 速度 上 与 fio 相近 ， 
通常 快 于 标准 VO PE. sfio 软件 包 也 提供 了 一 些 其 他 标准 VO 库 所 没有 的 新 特征 : 推广 了 LO 流 ， 
使 其 不 仅 可 以 代表 文件 ， 也 可 代表 存储 区 ; 可 以 编写 处 理 模块 ， 并 以 栈 方式 将 其 压 入 VO D, XX 
样 就 可 以 改变 一 个 流 的 操作 ; 较 好 的 异常 处 理 等 。 

Krieger. Stumm 和 Unrau[1992] 说 明了 另 一 个 替代 软件 包 , 它 使 用 了 了 映射 文件 一 一 mmap 函数 ， 
我 们 将 在 14.8 节 中 说 明 此 函数 。 该 新 软件 包 称 为 ASI (Alloc Stream Interface)。 其 编程 接口 类 似 

T UNIX 系统 存储 分 配 函 数 (malloc、realloc 和 free， 这 些 函 数 将 在 7.8 节 中 说 明 )。 与 sfio 

软件 包 相 同 ，ASI 使 用 指针 力图 减少 数据 复制 量 。 

许多 标准 VO 库 实 现在 C 畏 数 库 中 可 用 ， 这 种 C 亲 数 库 是 为 内 存 较 小 的 系统 ， 如 嵌入 式 系 统 设计 
的 。 这 些 实现 对 于 合理 内 存 要 求 的 关注 超过 对 可 移植 性 、 速 度 以 及 功能 性 等 方面 的 关注 。 这 种 类 型 函数 
库 的 两 种 实现 是 ， uClibe C FE (参阅 http://www.uclibc.org) 和 Newlib C FE (http://www. 
source.redhat.com/newlib). 


5.16 ”小结 


大 多 数 UNIX 应 用 程序 都 使 用 标准 VO FE. 本章 说 明了 该 库 提 供 的 很 多 函数 以 及 某 些 实现 细节 和 效 
率 方面 的 考虑 。 应 该 看 到 , 标准 VO 库 使 用 了 缓冲 技术 ， 而 它 正 是 产生 很 多 问题 、 引 起 许多 混淆 的 部 分 。 


习题 


5.1 用 setvbuf 实现 setbuf. 

5.2 5-5 中 的 程序 利用 每 次 一 行 IO (fgets 和 fputs 函数 ) 复制 文件 。 若 将 程序 中 的 MAXLINE 
改 为 4， 当 复 制 的 行 超过 该 最 大 值 时 会 出 现 什么 情况 ? 对 此 进行 解释 。 

53 printf 返回 0 值 表示 什么 ? 

54 下 面 的 代码 在 一 些 机 器 上 运行 正确 ， 而 在 另外 一 些 机 器 运行 时 出 错 ， 解 释 问 题 所 在 。 


f#include <stdio.h> 


int 
main (void) 
{ 
char C} 


5.5 
5.6 


5.7 
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while ((c = getchar()) != EOF) 
putchar (c): 
} 


对 标准 VO 流 如 何 使 用 fsync 函数 (0.3.13 节 ) ? 

在 图 1-7 和 图 1-10 程序 中 ， 打 印 的 提示 信息 没有 包含 换行 符 ， 程 序 也 没有 调用 fflush PN 
数 ， 请 解释 输出 提示 信息 的 原因 是 什么 ? 

基于 BSD 的 系统 提供 了 funopen 的 函数 调用 使 我 们 可 以 拦截 读 、 写 、 定 位 以 及 关闭 一 个 
流 的 调用 。 使 用 这 个 函数 为 FreeBSD 和 Mac OS X 实现 fmemopen. 
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系统 数据 文件 和 信息 





6.1 引言 


UNIX 系统 的 正常 运作 需要 使 用 大 量 与 系统 有 关 的 数据 文件 , 例如 , 口令 文件 /etc/passwd 
和 组 文件 /etc/group 就 是 经 常 被 多 个 程序 频繁 使 用 的 两 个 文件 。 用户 每 次 登录 UNIX 系统 ， 以 
及 每 次 执行 1s -1 命令 时 都 要 使 用 口令 文件 。 

由 于 历史 原因 ， 这些 数据 文件 都 是 ASCH 文本 文件 ， 并 且 使 用 标准 VO 库 读 这 些 文件 。 但 是 ， 
对 于 较 大 的 系统 ， 顺 序 扫 找 口令 文件 很 花费 时 间 ， 我 们 需要 能 够 以 非 ASCII 文本 格式 存放 这 些 文 
件 ， 但 仍 向 使 用 其 他 文件 格式 的 应 用 程序 提供 接口 。 对 于 这 些 数据 文件 的 可 移植 接口 是 本 章 的 主 
题 。 本 章 也 包括 了 系统 标识 函数 、 时 间 和 日 期 函数 。 


6.2 口令 文件 


UNIX 系统 口令 文件 (POSIX.1 则 将 其 称 为 用 户 数据 库 ) 包含 了 图 6-1 中 所 示 的 各 字段 ， 这 
些 字段 包含 在 <pwd.h> 中 定义 的 passwda 结构 中 。 


注意 ，POSIX.1 只 指定 passwd 结构 包含 的 10 个 字段 中 的 5 个 。 大 多 数 平台 至 少 支持 其 中 7 
个 字段 。BSD 派生 的 平台 支持 全 部 10 个 字段 。 


用 户 名 char *pw_name 
加 密 口令 char *pw_passwd 
数值 用 户 ID uid t pw uid 
数值 组 ID gid t pw gid 


注释 字段 char *pw_gecos 
初始 工作 目录 char *pw dir 
初始 shell 《用户 程序 ) | char *pw shell 
用 户 访问 类 char *pw_class 
下 次 更 改口 令 时 间 time t pw change 
账户 有 效 期 时 间 time t pw expire 





6-1 /etc/passwd 文件 中 的 字段 


由 于 历史 原因 ， 口 令 文件 是 /etc/passwd， 而 且 是 一 个 ASCI 文件 。 每 一 行 包含 图 6-1 中 
所 示 的 各 字段 ， 字 段 之 间 用 冒号 分 隔 。 例 如 ， 在 Linx 中 ， 该 文件 中 可 能 有 下 列 4 行 : 
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root:x:0:0:root:/root:/bin/bash 
squid:x:23:23::/var/spool/squid: /dev/null 
nobody: x: 65534: 65534:Nobody: /home: /bin/sh 
Sar:x:205:105:Stephen Rago: /home/sar:/bin/bash 


关于 这 些 登录 项 ， 请 注意 下 列 各 点 : 

。 通常 有 一 个 用 户 名 为 root 的 登录 项 ， 其 用 户 ID 是 RAP). 

es 加 密 口令 字段 包含 了 一 个 占 位 符 。 较 早期 的 UNIX 系统 版 本 中 ， 该 字段 存放 加 密 口令 字 。 
将 加 密 口 令 字 存 放 在 一 个 人 人 可 读 的 文件 中 是 一 个 安全 性 漏洞 ， 所 以 现在 将 加 密 口 令 字 
存放 在 另 一 个 文件 中 。 在 下 一 节 讨 论 口令 字 时 ， 我 们 将 详细 涉及 此 问题 。 

© ”口令 文件 项 中 的 某 些 字段 可 能 是 空 。 如 果 加 密 口令 字段 为 宅 ， 这 通常 就 意味 着 该 用 户 没有 口 
令 (不 推荐 这 样 做 )。squid 登录 项 有 一 空白 字段 : 注释 字段 。 空 白 注释 字段 不 产生 任何 影响 。 

e shell 字段 包含 了 一 个 可 执行 程序 名 ， 它 被 用 作 该 用 户 的 登录 shell。 若 该 字段 为 空 ， 则 取 系 统 默 
认 值 ， 通常 是 /bin/sh。 注意 ，squid 登录 项 的 该 字段 为 /dev/null。 显 然 ， 这 是 一 个 设备 ， 
不 是 可 执行 文件 ， 将 其 用 于 此 处 的 目的 是 ， 阻 止 任何 人 以 用 户 squid 的 名 义 登 录 到 该 系统 。 


(00 很 多 服务 对 于 帮助 它们 得 以 实施 的 不 同 守护 进程 使 用 不 同 的 用 户 ID ( 见 第 13 €), squid 
| 项 是 为 实现 squid 代理 高 速 线 存 服务 的 进程 设置 的 。 


。 为 了 阻止 一 个 特定 用 户 登 录 系 统 ， 除 使 用 /dev/null 外 ， 还 有 若干 种 替代 方法 。 常 见 的 
一 种 方法 是 ， 将 /bin/false 用 作 登 录 shell。 它 简单 地 以 不 成 功 〈 非 00 状态 终止 ， 该 
shell 将 此 种 终止 状态 判断 为 假 。 另 一 种 常见 方法 是 ， 用 /bin/true 禁止 一 个 账户 。 它 所 
做 的 一 切 是 以 成 功 (0) 状态 终止 。 某 些 系统 提供 nologin 命令 ， 它 打印 可 定制 的 出 错 
信息 ， 然 后 以 非 0 状态 终止 。 

« 使 用 nobody 用 户 名 的 一 个 目的 是 , 使 任何 人 都 可 登录 至 系统 ,但 其 用 户 ID (65534) 和 
组 ID (65534) 不 提供 任何 特权 。 BAP ID 和 组 ID 只 能 访问 人 人 皆 可 读 、 写 的 文件 。( 假 
定 用 户 ID 65534 和 组 ID 65534 并 不 拥有 任何 文件 ， 而 实际 情况 就 应 如 此 。) 

e 提供 finger(1) 命 令 的 某 些 UNIX 系统 支持 注释 字段 中 的 附加 信息 。 其 中 ， 各 部 分 之 间 
都 用 逗号 分 隔 用 户 姓 名 、 办 公 室 地 点 、 办 公 室 电话 号 码 以 及 家 庭 电 话 号 码 等 。 另 外 ， 
如 果 注 释 字 段 中 的 用 户 姓 名 是 一 个 &， 则 它 被 替换 为 登录 名 。 例 如 ， 可 以 有 下 列 记录 : 


sar:x:205:105:Steve Rago, SF 5-121, 555-1111, 555-2222:/home/sar:/bin/sh 
使 用 finger 命令 就 可 打印 Steve Rago 的 有 关 信息 。 


$ finger -p sar 


Login: sar Name: Steve Rago 
Directory: /home/sar Shell: /bin/sh 
Office: SF 5-121, 555-1111 Home Phone: 555-2222 
On since Mon Jan 19 03:57 (EST) on ttyvO (messages off) 

No Mail. 


即使 你 所 使 用 的 系统 并 不 支持 finger 命令 ， 这 些 信息 仍 可 存放 在 注释 字段 中 ， 该 字段 只 是 
一 个 注释 ， 并 不 由 系统 实用 程序 解释 。 
某 些 系统 提供 了 vipw 命令 ， 人 允许 管理 员 使 用 该 命令 编辑 口令 文件 。vipw 命令 串 行 化 地 更 
改口 令 文件 ， 并 且 确 保 它 所 做 的 更 改 与 其 他 相关 文件 保持 一 致 。 系 统 也 常常 经 由 图 形 用 户 界面 
(GUI) 提供 类 似 的 功能 。 
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POSIX.1 定义 了 两 个 获取 口令 文件 项 的 函数 。 在 给 出 用 户 登 录 名 或 数值 用 户 ID 后 , 这 两 个 函 
数 就 能 查看 相关 项 。 
#include<pwd.h> 
struct passwd *getpwuid(uid t uid); 


struct passwd *getpwnam(const char *name); 





179 getpwuid 函数 由 1s(1) 程 序 使 用 ， 它 将 i 节点 中 的 数字 用 户 ID BURA FP BRE. 在 键入 
登录 名 时 ，getpwnam 函数 由 login(1) 程 序 使 用 。 
这 两 个 函数 都 返回 一 个 指向 passwd 结构 的 指针 ,该 结构 已 由 这 两 个 函数 在 执行 时 填 入 
信息 。passwd 结构 通常 是 函数 内 部 的 静态 变量 ， 只 要 调用 任 一 相关 函数 ， 其 内 容 就 会 被 
重 写 。 
如 果 要 查看 的 只 是 登录 名 或 用 户 ID, 那么 这 两 个 POSIX.1 函数 能 满足 要 求 , 但 是 也 有 些 程序 
要 查看 整个 口令 文件 。 下 列 3 个 函数 则 可 用 于 此 种 目的 。 


#include <pwd.h> 
struct passwd *getpwent (void); 


BE: Ae, SE, AMM BAH Re, ORIS] NULL 


void setpwent (void); 





| 基本 POSIX.1 标准 没有 定义 这 3 个 函数 。 在 Single UNIX Specification 中 ， 它 们 被 定义 为 XSI 
”扩展 。 因 此， 可 预期 所 有 UNIX 实现 都 将 提供 这 些 函 数 。 


调用 getpwent 时 , 它 返 回 口令 文件 中 的 下 一 个 记录 项 如同 上面 所 述 的 两 个 POSIX.1 
函数 一 样 ， 它 返回 一 个 由 它 填 写 好 的 passwd 结构 的 指针 。 每 次 调用 此 函数 时 都 重 写 该 结 
构 。 在 第 一 次 调用 该 函数 时 ， 它 打开 它 所 使 用 的 各 个 文件 。 在 使 用 本 函数 时 ， 对 口令 文件 
中 各 个 记录 项 的 安排 顺序 并 无 要 求 。 某 些 系统 采用 散 列 算法 对 /etc/passwa 文件 中 各 项 
排序 。 

函数 setpwent 反 绕 它 所 使 用 的 文件 ，endpwent 则 关闭 这 些 文件 。 在 使 用 getpwent & 
看 完 口 令 文件 后 , 一定 要 调用 endpwent 关闭 这 些 文件 。getpwent 知道 什么 时 间 应 当 打 开 它 所 
使 用 的 文件 (第 一 次 被 调用 时 )， 但 是 它 并 不 知道 何 时 关闭 这 些 文件 。 


总 实例 
6-2 程序 给 出 了 getpwnam 函数 的 一 个 实现 。 


#include <pwd.h> 
#include «stddef.h» 
#include <string.h> 


struct passwd * 
getpwnam(const char *name) 
{ 


struct passwd *ptr; 


setpwent (); 
while ((ptr = getpwent()) != NULL) 
if (strcmpí(name, ptr->pw_name) == 0) 
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break; /* found a match */ 
endpwent () ; 
return(íptr); /* ptr is NULL if no match found */ 


6-2 getpwnam 函数 
在 函数 开始 处 调用 setpwent 是 自我 保护 性 的 措施 , 以 便 确 保 如 果 调 用 者 在 此 之 前 已 经 调用 
getpwent 打开 了 有 关 文 件 情 况 下 , 反 绕 有 关 文 件 使 它们 定位 到 文件 开始 处 。getpwnam 和 SSEDNUES 
完成 后 不 应 使 有 关 文 件 仍 处 于 打开 状态 ， 所 以 应 调用 endpwent 关闭 它们 。 a 


6.3 ”阴影 口令 


加 密 口令 是 经 单 向 加 密 算法 处 理 过 的 用 户口 令 副 本 。 因 为 此 算法 是 单 向 的 ， 所 以 不 能 从 加 密 
口令 猜测 到 原来 的 口令 。 

历史 上 使 用 的 算法 总 是 在 64 字符 集 [a-zA-z0-9./] 中 产生 13 个 可 打印 字符 C Morris 和 
Thompson [1979])。 某 些 较 新 的 系统 使 用 其 他 方法 ， 如 MD5 或 SHA-1 算法 ， 对 口令 加 密 ， 产 生 更 长 的 
加 密 口 令 字符 串 。( 加 密 口令 的 字符 越 多 ， 这 些 字符 的 组 合 也 就 越 多 ， 于 是 用 各 种 可 能 组 合 来 猜测 口令 
的 难度 就 越 大 。) 当 我 们 将 单个 字符 放 在 加 密 口 令 字 段 中 时 ， 可 以 确保 任 一 加 密 口 令 都 不 会 与 其 相 匹配 。 

对 于 一 个 加 密 口 令 , 找 不 到 一 种 算法 可 以 将 其 反 变换 到 明文 口令 (明文 口令 是 在 Password: 
提示 后 键入 的 口令 )。 但 是 可 以 对 口令 进行 猜测 ， 将 猜测 的 口令 经 单 向 算法 变换 成 加 密 形式 ， 然 
后 将 其 与 用 户 的 加 密 口 令 相 比较 。 如 果 用 户口 令 是 随机 选择 的 ， 那 么 这 种 方法 并 不 是 很 有 用 。 但 
是 用 户 往往 以 非 随 机 方式 选择 口令 〈 如 配偶 的 姓名 、 街 名 、 宠 物 名 等 )。 一 个 经 常 重复 的 实验 是 
先 得 到 一 份 口令 文件 ， 然 后 用 试探 方法 猜测 口令 。(Garfinkel 等 [2003] 的 第 4 章 对 UNIX 口令 及 口 
令 加 密 处 理 方 案 的 历史 情况 及 细节 进行 了 说 明 。) 

为 使 企图 这 样 做 的 人 难以 获得 原始 资料 《加 密 口令 )， 现 在 ， 某 些 系统 将 加 密 口 令 存放 在 另 
- -个 通常 称 为 阴影 口令 (shadow password) 的 文件 中 。 该 文件 至 少 要 包含 用 户 名 和 加 密 口 令 。 5 
该 口令 相关 的 其 他 信息 也 可 存放 在 该 文件 中 (图 6-3)。 


struct spwd 成 员 


用 户 登 录 名 char *sp namp 
加 密 口 令 char *sp pwdp 
上 次 更 改口 令 以 来 经 过 的 时 间 int sp lstchg 
经 多 少 天 后 允许 更 改 int sp min 


要 求 更 改 尚 余天 数 int sp_max 

超期 警告 天 数 int sp warn 

账户 不 活动 之 前 尚 余天 数 int sp inact 

账户 超期 天 数 int sp expire 

保留 unsigned int sp. flag 





图 6-3 /etc/shadow 文件 中 的 字段 
只 有 用 户 登 录 名 和 加 密 口 令 这 两 个 字段 是 必须 的 。 其 他 的 字段 控制 口令 更 改 的 频率 ， 或 者 说 
口令 的 衰老 以 及 账户 仍然 处 于 活动 状态 的 时 间 。 
阴影 口令 文件 不 应 是 一 般 用 户 可 以 读 取 的 。 仅 有 少数 几 个 程序 需要 访问 加 密 口 令 ,如 1login(1) 
和 passwqd(1)， 这 些 程序 常常 是 设置 用 户 ID 为 root 的 程序 。 有 了 阴影 口令 后 ， 兽 通 口令 文件 
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/etc/passwd 可 由 各 用 户 自由 读 取 。 
在 Linux 3.2.0 和 Solaris 10 中 ， 与 访问 口令 文件 的 一 组 函数 相 类 似 ， 有 另 一 组 函数 可 用 于 访 
问 阴影 口令 文件 。 
#include <shadow.h> 


struct spwd *getspnam(const char *name); 


struct spwd *getspent (void) ; 


两 个 函数 返回 值 ， 若 成 功 ， 返 回 指针 ; AH, JBI NULL 


void setspent(void); 





void endspent (void); 


在 FreeBSD 8.0 和 Mac OS X 10.6.8 F, 没有 阴影 口令 结构 。 附 加 的 账户 信息 存放 在 口令 文件 
中 《〈 见 图 6-1)。 


6.4 组 文件 


UNIX 组 文件 (POSIX.1 称 其 为 组 数据 库 ) 包 含 了 图 6-4 中 所 示 字 段 ,这 些 字段 包含 在 <grp.h> 
中 所 定义 的 group 结构 中 。 


Valet ageoianee | *gr_name 
a char *gr passwd 
数值 组 ID int gr gid 
ele S A char **gr_mem 


图 6-4 /etc/group 文件 中 的 字段 


字段 gr. mem 是 一 个 指针 数组 , 其 中 每 个 指针 指向 一 个 属于 该 组 的 用 户 名 。 该 数组 以 null 指针 结尾 。 
可 以 用 下 列 两 个 由 POSIX.1 定义 的 函数 来 查看 组 名 或 数值 组 ID. 


#include <grp.h> 





struct group *getgrgid(gid t gid); 
struct group *getgrnam(const char *nmame); 
两 个 函数 返回 值 : 若 成 功 ， 返 回 指 针 ;， 若 出 错 ， 返 回 NULL 
如 同 对 口令 文件 进行 操作 的 函数 一 样 ， 这 两 个 函数 通常 也 返回 指向 一 个 静态 变量 的 指针 ， 在 
每 次 调用 时 都 重 写 该 静态 变量 。 
如 果 需 要 搜索 整个 组 文件 ， 则 须 使 用 另外 几 个 函数 。 下 列 3 个 函数 类 似 于 针对 口令 文件 的 3 
个 函数 。 


#finclude <grp.h> 





struct group *getgrent (void); 


返回 值 : 若 成 功 ， 返 回 指针 : 若 出 错 或 到 达 文 件 尾 端 ， 返 回 NULL 


void setgrent(void); 


void endgrent(void); 


， ik 3 个 函数 不 是 基本 POSIX.1 标准 的 组 成 部 分 。Singje UNIX Specification 的 XSI 扩展 定义 了 


:这些 函数 。 所 有 UNIX 系统 都 提供 这 3 个 函数 。 
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setgrent 函数 打开 组 文件 《如 若 它 尚 末 被 打开 ) 并 反 绕 它 。getgrent 函数 从 组 文件 中 读 
下 一 个 记录 ， 如 若 该 文件 尚未 打开 ， 则 先 打 开 它 。endgrent 函数 关闭 组 文件 。 


6.5 附属 组 ID 


在 UNIX 系统 中 ， 对 组 的 使 用 已 经 做 了 些 更 改 。 在 V7 中 ， 每 个 用 户 任 何 时 候 都 只 属于 一 个 
组 。 当 用 户 登 录 时 ， 系 统 就 按 口 令 文件 记录 项 中 的 数值 组 ID， 赋 给 他 实际 组 ID。 可 以 在 任何 时 
候 执行 newgrp(1) 以 更 改组 ID. WR newgrp 命令 执行 成 功 ( 关 于 权限 规则 ， 请 参阅 手册 )， 则 
实际 组 ID 就 更 改 为 新 的 组 ID， 它 将 被 用 于 后 续 的 文件 访问 权限 检查 。 热 行 不 带 任何 参数 的 
newgrp， 则 可 返回 到 原来 的 组 。 

这 种 组 成 员 形 式 一 直 维 持 到 1983 年 左右 .此 时 ,4.2BSD 引入 了 附属 组 IDCsupplementary group 
ID) 的 概念 。 我 们 不 仅 可 以 属于 口令 文件 记录 项 中 组 ID 所 对 应 的 组 ， 也 可 属于 多 至 16 个 另外 的 
ZH. 文件 访问 权限 检查 相应 被 修改 为 : 不 仅 将 进程 的 有 效 组 ID 与 文件 的 组 ID 相 比 较 ， 而且 也 将 
所 有 附属 组 ID 与 文件 的 组 ID 进行 比较 。 


附属 组 ID 是 POSIX.) 要 求 的 特性 。( 在 较 早 的 POSIX.) 版 本 中 ， 该 特性 是 可 选 的 。) HE 
| NGROUPS MAX ( 见 图 2-11) 规定 了 附属 组 ID SHAE, EAER 16 (LE 2-15), 


使 用 附属 组 ID 的 优点 是 不 必 再 显 式 地 经 常 更 改组 。 一 个 用 户 会 参与 多 个 项 目 ， 因 此 也 就 要 
同时 属于 多 个 组 ， 此 类 情况 是 常 有 的 。 
为 了 获取 和 设置 附属 组 ID， 提 供 了 下 列 3 个 函数 。 
#include <unistd.h> 
int getgroups(int gidsetsize, gid t grouplist(]); 
返回 值 ， 若 成 功 ， 返 回 附属 组 ID 数量 ， 若 出 错 ， 返 回 -1 


#include <grp.h> /* on Linux */ 
#include <unistd.h> /* on FreeBSD, Mac OS X, and Solaris */ 


int setgroups(int ngroups, const gid t grouplist(]) ; 


#include <grp.h> /* on Linux and Solaris */ 
#include <unistd.h> /* on FreeBSD and Mac OS X */ 
int initgroups(const char *username, gid t basegid); 
两 个 函数 的 返回 值 : ERY., EO: 若 出 错 ， 返 回 -1 
在 这 3 个 函数 中 ，POSIX.1 只 说 明了 getgroups。 因 为 setgroups 和 initgroups 是 特 
” 权 操 作 ， 所 以 它们 并 非 POSIX.1 的 组 成 部 分 。 但是， 本 书 说 明 的 所 有 4 种 平台 都 支持 这 3 个 函数 。 
' & MacOS X 10.6.8 'P, basegid 被 声明 为 int 类 型 。 


getgroups 将 进程 所 属 用 户 的 各 附属 组 ID 填写 到 数组 grouplist +, 填写 入 该 数组 的 附属 组 
ID 数 最 多 为 gidsetsize 个 。 实 际 填写 到 数组 中 的 附属 组 ID 数 由 函数 返回 。 

作为 一 种 特殊 情况 ， 如 若 gidsetsize 为 0， 则 函数 只 返回 附属 组 ID 数 ， 而 对 数组 grouplist 则 
不 做 修改 。( 这 使 调用 者 可 以 确定 grouplist 数组 的 长 度 ， 以 便 进 行 分 配 。) 

setgroups 可 由 超级 用 户 调用 以 便 为 调用 进程 设置 附属 组 ID Æ. grouplist 是 组 ID RA, 
而 ngroups 说 明了 数组 中 的 元 素数 。ngroups 的 值 不 能 大 于 NGROUPS_MAX。 

通常 ， 只 有 initgroups 函数 调用 setgroups, initgroups 读 整 个 组 文件 (用 前 面 说 明 
的 函数 getgrent、setgrent 和 endgrent)， 然 后 对 username 确定 其 组 的 成 员 关 系 。 然 后 ， 
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它 调用 setgroups, 以 便 为 该 用 户 初始 化 附属 组 ID K. AW initgroups 要 调用 setgroups， 
所 以 只 有 超级 用 户 才 能 调用 initgroups。 除 了 在 组 文件 中 找到 username 是 成 员 的 所 有 组 ， 
initgroups 也 在 附属 组 ID 表 中 包括 了 basegid. basegid 是 username 在 口令 文件 中 的 组 ID. 

只 有 少数 几 个 程序 调用 initgroups, fli 1ogin(1) 程 序 在 用 户 登 录 时 调用 该 函数 。 


6.6 ”实现 区 别 


我 们 已 讨论 了 Linux 和 Solaris 支持 的 阴影 口令 文件 。FreeBSD 和 Mac OS X 则 以 不 同方 式 存 
储 加 密 口 令 字 。 图 6-5 总 结 了 本 书 涉 及 的 4 种 平台 如 何 存储 用 户 和 组 信息 。 


a eae FreeBSD 8.0 Linux 3.2.0 4 pe X Solaris 10 






















账户 信息 /etc/passwd /etc/passwd /etc/passwd 
aw De /etc/master.passwd | /etc/shadow /etc/shadow 
是 否 是 数列 口令 文件 ? | 是 T T 






组 信息 /etc/group 


图 6-5 账户 实现 的 区 别 


在 FreeBSD 中 ， 阴 影 口令 文件 是 /etc/master .passwd。 可 以 使 用 特殊 命令 编辑 该 文件 ， 
它 会 从 阴影 口令 文件 产生 /etc/passwd 的 一 个 副本 。 另 外 ， 也 产生 该 文件 的 散 列 副本 。 
/etc/pwd.db 是 /etc/passwd 的 散 列 副本 , /etc/spwd.db 是 /etc/master .passwd Hm 
列 版 本 。 这 些 为 大 型 安装 的 系统 提供 了 更 好 的 性 能 。 

但 是 ，Mac OS X 只 在 单 用 户 模式 下 使 用 /etc/passwd 和 /etc/master .passwd (在 维护 
系统 时 ， 单 用 户 模 式 通常 意味 着 不 能 提供 任何 系统 服务 )。 在 正常 运行 期 间 的 多 用 户 模式 ， 目 录 
服务 守护 进程 提供 对 用 户 和 组 账户 信息 的 访问 。 

AR Linux 和 Solaris 支持 类 似 的 阴影 口令 接口 ， 但 两 者 之 间 存 在 某 些 细微 的 差别 。 例 如 ， 图 
6-3 中 所 示 的 整数 字段 在 Solaris 中 定义 为 int 类 型 ， 而 在 Linux 中 则 定义 为 long int. 5 — 
差别 是 账户 -不 活动 字段 Solaris 将 其 定义 为 自用 户 上 次 登录 后 到 下 次 账户 自动 失效 之 间 的 天 数 ， 
而 Linux 则 将 其 定义 为 达到 最 大 口令 年 龄 尚 余天 数 。 

在 很 多 系统 中 ， 用 户 和 组 数据 库 是 用 网 络 信 息 服务 (Network Information Service, NIS) 实现 
的 。 这 使 管理 人 员 可 编辑 数据 库 的 主 副本 ， 然 后 将 它 自 动 分 发 到 组 织 中 的 所 有 服务 器 上 。 客 户 端 
系统 联系 服务 器 以 查看 用 户 和 组 的 有 关 信 息 。NIS+ 和 轻 量 级 目录 访问 协议 (Lightweight Directory 
Access Protocol，LDAP) 提供 了 类 似 功 能 。 很 多 系统 通过 配置 文件 /etc/nsswitch.conf 控制 
用 于 管理 每 一 类 信息 的 方法 。 


6.7 ”其 他 数据 文件 


至 此 仅 讨 论 了 两 个 系统 数据 文件 一 一 口令 文件 和 组 文件 。 在 日 常 操作 中 ，UNIX 系统 还 使 用 很 多 
其 他 文件 .例如 , BSD 网 络 软 件 有 一 个 记录 各 网 络 服务 器 所 提供 服务 的 数据 文件 (/etc/services)， 
有 一 个 记录 协议 信息 的 数据 文件 (/etc/protocols )， 还 有 一 个 则 是 记录 网 络 信息 的 数据 文件 


/etc/group /etc/group 


(/etc/networks)。 幸 运 的 是 ， 对 于 这 些 数据 文件 的 接口 都 与 上 述 对 口令 文件 和 组 文件 的 相似 。 


一般 情况 下 ， 对 于 每 个 数据 文件 至 少 有 3 个 函数 。 
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(D get BRA: 读 下 一 个 记录 ， 如 果 需 要 ， 还 会 打开 该 文件 。 此 种 函数 通常 返回 指向 一 个 结 
构 的 指针 。 当 已 达到 文件 尾 端 时 返回 空 指针 。 大 多 数 get 函数 返回 指向 一 个 静态 存储 类 结构 的 指 
针 ， 如 果 要 保存 其 内 容 ， 则 需 复制 它 。 

(2) set BM: 打开 相应 数据 文件 〈 如 果 尚 末 打 开 )， 然 后 反 绕 该 文件 。 如 果 希 望 在 相应 文 
件 起 始 处 开始 处 理 ， 则 调用 此 函数 。 

(3) end AM: 关闭 相应 数据 文件 。 如 前 所 述 ， 在 结束 了 对 相应 数据 文件 的 读 、 写 操作 后 ， 
总 应 调用 此 函数 以 关闭 所 有 相关 文件 。 

另外 , 如 果 数 据 文件 支持 某 种 形式 的 键 搜 索 ,， 则 也 提供 搜索 具有 指定 键 的 记录 的 例 程 。 例 如 ， 
对 于 口令 文件 ， 提 供 了 两 个 按键 进行 搜索 的 程序 ，getpwnam 寻找 具有 指定 用 户 名 的 记录 ; 
getpwuid 寻找 具有 指定 用 户 ID 的 记录 。 

图 6-6 中 列 出 了 一 些 这 样 的 例 程 ， 这 些 都 是 UNIX 常用 的 。 在 图 中 列 出 了 针对 口令 文件 和 组 
文件 的 函数 ， 这 些 已 在 前 面 说 明 过 。 图 中 也 列 出 了 一 些 与 网 络 有 关 的 函数 。 对 于 图 中 列 出 的 所 有 
数据 文件 都 有 get. set 和 end AX. 


Ta 


/etc/passwd <pwd.h> passwd getpwnam. getpwuid 
/etc/group «grp.h» group getgrnam. getgrgid 
/etc/shadow <shadow.h> spwd getspnam 


/etc/hosts «netdb.h» hostent getnameinfo. getaddrinfo 
/etc/networks «netdb.h» netent getnetbyname. getnetbyaddr 
/etc/protocols «netdb.h» protoent Getprotobyname. getprotobynumber 
/etc/services «netdb.h» servent getservbyname. getservbyport 





e-6 访问 系统 数据 文件 的 一 些 例 程 


Æ Solaris P, Hl 6-6 中 的 最 后 4 个 数据 文件 都 是 符号 链接 ， 它 们 都 链接 到 目录 /etc/inet 
下 的 同名 文件 上 。 大 多 数 UNIX 系统 实现 都 有 类 似 于 图 中 所 列 的 附加 函数 ， 但 是 这 些 附 加 函数 都 
“ 曾 在 处 理 系统 管理 文件 ， 寺 用 于 各 个 实现 。 


6.8 ”登录 账户 记录 


大 多 数 UNIX 系统 都 提供 下 列 两 个 数据 文件 ，utmp 文件 记录 当前 登录 到 系统 的 各 个 用 户 ; wtmp 
文件 跟踪 各 个 登录 和 注销 事件 。 在 V7 中 , 每 次 写 入 这 两 个 文件 中 的 是 包含 下 列 结构 的 一 个 二 进 制 记录 : 


struct utmp 1 


char ut line[8]; /* tty line: "ttyhO", "ttydO", "ttypO", ... */ 
char ut name[8]; /* login name */ 
long ut time; /* seconds since Epoch */ 


}; 

SRN, login 程序 填写 此 类 型 结构 ， 然 后 将 其 写 入 到 utmp 文件 中 ， 同 时 也 将 其 添 写 到 
wtmp 文件 中 。 注 销 时 ，init 进程 将 utmp 文件 中 相应 的 记录 擦 除 (每 个 字 节 都 填 以 null 字 节 )， 
并 将 一 个 新 记录 添 写 到 wtmp 文件 中 。 在 wtmp 文件 的 注销 记录 中 ，ut_name 字段 清除 为 0。 在 
系统 再 启动 时 ,以 及 更 改 系统 时 间 和 日 期 的 前 后 , 都 在 wtmp 文件 中 追加 写 特殊 的 记录 项 。 who(1) 
程序 读 取 utmp 文件 ,并 以 可 读 格 式 打印 其 内 容 。 后 来 的 UNIX 版 本 提供 last(1) 命 令 , 它 读 wtmp 
文件 并 打印 所 选择 的 记录 。 
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大 多 数 UNIX 版 本 仍 提供 utmp 和 wtmp 文件 ， 但 正如 所 期 望 的 ， 其 中 的 信息 量 却 增加 了 。V7 中 
写 入 的 20 字 节 的 结构 在 SVR2 中 已 扩充 为 36 字 节 , 而 在 SVR4 中 , utmp 结构 已 扩充 为 多 于 350 字 节 。 


在 Solaris 中 ， 这 些 记录 的 详细 格式 请 参见 手册 页 utmpx(4)。Solaris 10 中 这 两 个 文件 都 在 目 
 X/var/adm P, Solaris 提供 了 很 多 函数 ( X, getutx(3) ) 读 或 写 这 两 个 文件 。 

Æ FreeBSD 8.0 fe Linux 3.20 中 , 登录 记录 的 格式 请 参见 手册 页 utmp(5)。 这 两 个 文件 的 路 径 
| £X /var/run/utmp fe/var/log/wtmp, Æ Mac OS X 10.6.8 中 , utmp 和 wtmp 文件 不 存在 。 
| Æ Mac OS X 10.5 P, wimp 文件 中 的 信息 可 以 从 系统 登录 工具 中 获得 ，utmpx 文件 包含 了 活动 
:的 登录 会 话 的 信息 。 


6.9 ”系统 标识 


POSIX.! 定义 了 uname 函数 ， 它 返回 与 主机 和 操作 系统 有 关 的 信息 。 


#include «sys/utsname.h» 


int uname (struct utsname *name); 





通过 该 函数 的 参数 向 其 传递 一 个 utsname 结构 的 地 址 ， 然 后 该 Se POSIX.1 
只 定义 了 该 结构 中 最 少 需 提供 的 字段 (它们 都 是 字符 数组 )， 而 每 个 数组 的 长 度 则 由 实现 确定 。 
某 些 实现 在 该 结构 中 提供 了 另外 一 些 字段 。 


struct utsname { 
char sysname[ ];  /* name of the operating system */ 
char nodename[ ]; /* name of this node */ 
char release[ ]: /* current release of operating system */ 
char version[ ]; /* current version of this release */ 
char machine[ ]: /* name of hardware type */ 

hi 


每 个 字符 串 都 以 nl 字 节 结尾 。 本 书 讨论 的 4 种 平台 支持 的 最 大 名 字 长 度 (包含 终止 null + 
35» 列 于 图 6-7 中 。utsname 结构 中 的 信息 通常 可 用 unamet{1) 命 令 打 印 。 
| POSIX.1 #4 nodename 元 素 可 能 并 不 适用 于 在 通信 网 络 上 引用 主机 。 此 函数 来 自 于 System 
，V， 在 早期 ，nodename 元 素 适用 于 在 UUCP 网 络 上 引用 主机 。 
! 还 要 认识 到 ， 在 此 结构 中 并 没有 给 出 有 关 POSIX.1 版 本 的 信息 。 应 当 使 用 2.6 节 中 所 说 明 的 
| POSIX VERSION 获得 该 信息 。 
最 后 ， 此 函数 只 给 出 了 一 种 获取 该 结构 中 信息 的 方法 ， 至 于 如 何 初 始 化 这 些 信 息 ，POSIX.1 

.没有 给 出 任何 说 明 。 


历史 上 ,BSD 派生 的 系统 提供 gethostname 函数 , 它 只 返回 主机 名 , 该 名 字 通 常 就 是 TCP/IP 
网 络 上 主机 的 名 字 。 


#include <unistd.h> 


int gethostname (char *name, int namelen); 





namelen 参数 指定 name BM KKE, 如 若 提供 足够 的 空间 , 则 通过 name 返回 的 字符 串 以 null 
字 节 结尾 。 如 若 没 有 提供 足够 的 室 间 ， 则 没有 说 明 通 过 name 返回 的 字符 串 是 否 以 null 结尾 。 
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现在 ,gethostname 函数 已 在 POSIX.1 中 定义 , 它 指定 最 大 主机 名 长 度 是 HOST_NAME_MAX。 
图 6-7 中 总 结 列 出 了 本 书 讨论 的 4 种 实现 支持 的 最 大 名 字 长 度 。 


最 大 名 字 长 度 


FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 





uname 257 
gethostname 256 


图 6-7 系统 标识 名 限制 


如 果 宿 主机 联接 到 TCP/IP 网 络 中 ， 则 此 主机 名 通常 是 该 主机 的 完整 域名 。 [188] 
hostname(l) 命 令 可 用 来 获取 和 设置 主机 名 。( 超 级 用 户 用 一 个 类 似 的 函数 sethostname 
来 设置 主机 名 。) 主机 名 通常 在 系统 自 举 时 设置 ， 它 由 /etc/rc 或 init 取 自 一 个 启动 文件 。 


6.10 时间 和 日 期 例 程 


由 UNIX 内 核 提 供 的 基本 时 间 服 务 是 计算 自 协调 世界 时 〈Coordinated Universal Time, UTC) 
公元 1970 年 1 月 1 H 00:00:00 这 一 特定 时 间 以 来 经 过 的 秒 数 。1.10 节 中 曾 提 及 这 种 秒 数 是 以 数 
PXA timet 表示 的 ， 我 们 称 它们 为 日 历时 间 。 日 历时 间 包 括 时 间 和 日 期 。UNIX 在 这 方面 与 
其 他 操作 系统 的 区 别 是 : Ca) 以 协调 统一 时 间 而 非 本 地 时 间 计 时 ，(b) 可 自动 进行 转换 ， 如 变换 
到 夏令 时 ，(c) 将 时 间 和 日 期 作为 一 个 量 值 保存 。 

time 函数 返回 当前 时 间 和 日 期 。 


#include <time.h> 


time t time(time t *calptr); 





时 间 值 作为 函数 值 返回 。 如 果 参 数 非 空 ， vi REC calptr 指向 "-—— 
POSXI.1 的 实时 扩展 增加 了 对 多 个 系统 时 钟 的 支持 。 在 Single UNIX Specification V4 中 ,控制 这 
些 时 钟 的 接口 从 可 选 组 被 移 至 基本 组 。 时 钟 通过 clockid_t 类 型 进行 标识 。 图 6-8 给 出 了 标准 值 。 


CLOCK REALTIME 实时 系统 时 间 

CLOCK MONOTONIC POSIX MONOTONIC CLOCK | 不 带 负 跳 数 的 实时 系统 时 间 
CLOCK PROCESS CPUTIME ID | POSIX CPUTIME 调用 进程 的 CPU 时 间 
CLOCK THREAD CPUTIME ID POSIX THREAD CPUTIME 调用 线程 的 CPU 时 间 


图 6-8 时钟 类 型 标识 符 
clock gettime 函数 可 用 于 获取 指定 时 钟 的 时 间 ， 返 回 的 时 间 在 4.2 节 介 绍 的 timespec 
结构 中 ， 它 把 时 间 表 示 为 秒 和 纳 秘 。 


#include «sys/time.h» 





int clock_gettime (clockid t clock id, struct timespec *fsp); 


返回 值 ; ERD, 返回 0; Aud, 返回 -1 





当时 钟 ID 设置 为 CLOCK_REALTIME Ff, clock gettime MAGHET 5 time 函数 类 似 的 功能 ， 
不 过 在 系统 支持 高 精度 时 间 值 的 情况 下 ，clock_gettime 可 能 比 time 函数 得 到 更 高 精度 的 时 间 值 。 
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#include <sys/time.h> 


int clock getres(clockid t clock id, struct timespec *fsp); 
返回 值 ， 着 成 功 ， 返 回 0: 车 出 错 ， 返 回 -1 
clock getres 函数 把 参数 tsp 指向 的 timespec 结构 初始 化 为 与 clock id 参数 对 应 的 时 钟 
精度 。 例 如 ， 如 果 精 度 为 1 毫秒 ， 则 tv sec 字段 就 是 0，tv_nsec 字段 就 是 1 000000. 
要 对 特定 的 时 钟 设置 时 间 ， 可 以 调用 clock settime 函数 。 


#include <sys/time.h> 





int clock settime(clockid t clock id, const struct timespec *ftsp); 


BEE: ERHI., RE o: Fh, gE- 





我 们 需要 适当 的 特权 来 更 改 时 钟 值 ， 但 是 有 些 时 钟 是 不 能 修改 的 。 
| 历史 上 ， 在 System V 派生 的 系统 实现 中 ， 调 用 stime(2) 函 数 来 设置 系统 时 间 ， 而 在 BSD 派 
” 生 的 系统 中 调用 settimeofday(2) 设 置 系统 时 间 。 


SUSv4 指定 gettimeofday 函数 现在 已 弃 有 用。 然而， 一 些 程 序 仍然 使 用 这 个 函数 ， 因 为 与 
time 函数 相 比 ，gettimeofday 提供 了 更 高 的 精度 (可 到 微 秒 级 )。 


#include <sys/time.h> 


int gettimeofday(struct timeval *restrict fp, void *restrict tp); 





tp 的 唯一 合法 值 是 NULL， 其 他 值 将 产生 不 确定 的 结果 。 某 些 平台 支持 用 ftzp 说 明 时 区 ， 但 
这 完全 依 实现 而 定 ，Single UNIX Specification 对 此 并 没有 定义 。 

gettimeofday 函数 以 距 特 定时 间 (1970 年 1 H 1 EH 00 : 00: 000. 的 秒 数 的 方式 将 当前 时 
[RI ££ AGE tp 指向 的 timeval 结构 中 ， 而 该 结构 将 当前 时 间 表 示 为 秒 和 微 秒 。 

一 旦 取得 这 种 从 上 述 特 定时 间 经 过 的 秒 数 的 整 型 时 间 值 后 , 通常 要 调用 函数 将 其 转换 为 分 解 的 
时 间 结 构 ， 然 后 调用 另 一 个 函数 生成 人 们 可 读 的 时 间 和 日 期 。 图 6-9 说 明了 各 种 时 间 函 数 之 间 的 关 
系 。( 图 中 以 虚线 表示 的 3 个 函数 localtime, mktime 和 strftime 都 受到 环境 变量 Tz 的 影响 ， 


我 们 将 在 本 节 的 最 后 部 分 对 其 进行 说 明 。 点 划 线 表 示 了 如 何 从 时 间 相 关 的 结构 获得 日 历时 间 。) 


两 个 函数 Localtime 和 gmtime 将 日 历时 间 转换 成 分 解 的 时 间 ， 并 将 这 些 存放 在 一 个 tm 结构 中 。 


struct tm { /* a broken-down time */ 
int tm sec; /* seconds after the minute: [0 - 60] */ 
int tm min; /* minutes after the hour: [0 - 59] */ 
int tm hour; /* hours after midnight: [0 - 23] */ 
int tm mday; /* day of the month: [1 - 31] */ 
int tm mon; /* months since January: [0 - 11] */ 
int tm year; /* years since 1900 */ 
int tm wday; /* days since Sunday: [0 - 6) */ 
int tm yday; /* days since January 1: [0 - 365] */ 
int tm isdst; /* daylight saving time flag: «0, 0, >0 */ 


E 
秒 可 以 超过 59 的 理由 是 可 以 表示 润 秒 。 注 意 ， 除 了 月 日 字段 ， 其 他 字段 的 值 都 以 0 开始 。 如 果 夏 令 
时 生效 ， 则 夏令 时 标志 值 为 正 ， 如 果 为 非 夏令 时 时 间 ， 则 该 标志 值 为 0; 如 果 此 信息 不 可 用 ,， 则 其 值 为 负 。 
j Single UNIX Specification 的 以 前 版 本 允许 双 润 秒 ， 于 是 ，tm_sec 值 的 有 效 范 国 是 0~61。 
| UTC 的 正式 定义 不 允许 双 润 秒 ， 所 以 ， 现 在 tm sec 值 的 有 效 范围 定义 为 0~ 60。 
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gettimeofday 


人 内核 
6-9 ”各 个 时 间 户 数 之 间 的 关系 


#include <time.h> 


struct tm *gmtime(const time t *calpir); 


struct tm *localtime(const time t *calptr); 
两 个 函数 的 返回 值 ， 指 向 分 解 的 tm 结构 的 指针 ， 若 出 错 ， 返 回 NULL 
localtime 和 gmtime 之 间 的 区 别 是 : localtime 将 日 历时 间 转 换 成 本 地 时 间 (考虑 到 本 
地 时 区 和 夏令 时 标志 )， 而 gmtime 则 将 日 历时 间 转 换 成 协调 统一 时 间 的 年 、 月 、 日 、 时 、 分 、 
秒 、 周 日 分 解 结构 。 
函数 mktime 以 本 地 时 间 的 年 、 月 、 日 等 作为 参数 ， 将 其 变换 成 time_t tE. 


#include <time.h> 





time t mktime (struct tm */mptr); 





函数 strftime 是 一 个 类 似 于 printf 的 时 间 值 函数 。 它 非常 复杂 , 可 以 通过 可 用 的 多 个 参 
数 来 定制 产生 的 字符 串 。 


#include «time.n» 


size t strftime(char *restrict buf, size t maxsize, 
const char *restrict format, 
const struct tm *restrict Imptr); 


size t strftime l(char *restrict buf, size t maxsize, 
const char *restrict format, 
const struct tm *restrict /mptr, locale t locale); 





两 个 函数 的 返回 值 ， 若 有 空间 ， 返 回 存 入 数组 的 字符 数 ， 否 则 ， 返 回 0 
两 个 较 早 的 函数 - - -asctime 和 ctime 能 用 于 产生 一 个 26 字 节 的 可 打印 的 字符 囊 , 类似 于 
date(1) 命 令 默 认 的 输出 。 然 而 ， 这 些 函数 现在 已 经 被 标记 为 齐 用 ， 因 为 它们 易 受 到 缓冲 区 溢出 问 
题 的 影响 。 


strftime 1 允许 调用 者 将 区 域 指定 为 参数 ， 除 此 之 外 ，strftime 和 strftime_1 AX 
是 相同 的 。strftime 使 用 通过 Tz 环境 变量 指定 的 区 域 。 
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tmptr 参数 是 要 格式 化 的 时 间 值 ， 由 一 个 指向 分 解 时 间 值 tm 结构 的 指针 说 明 。 格 式 化 结果 存 
放 在 一 个 长 度 为 maxsize 个 字符 的 buf BAF, 如 果 buf 长 度 足 以 存放 格式 化 结果 及 一 个 null 终止 
符 ， 则 该 函数 返回 在 buf 中 存放 的 字符 数 〔 不 包括 null 终止 符 )， 否 则 该 函数 返回 0。 
format 参数 控制 时 间 值 的 格式 。 如 同 printf 函数 -- 样 ， 转 换 说 明 的 形式 是 百 分 号 之 后 跟 -- 
个 特定 字符 。formar 中 的 其 他 字符 则 按 原样 输出 。 两 个 连续 的 百 分 号 在 输出 中 产生 一 个 百 分 号 。 
与 printf 函数 的 不 同 之 处 是 ， 每 个 转换 说 明 产 生 一 个 不 同 的 定 长 输出 字符 串 ， 在 format FP 
中 没有 字段 宽度 修饰 符 。 图 6-10 中 列 出 了 37 种 ISO C 规定 的 转换 说 明 。 


Thursday 

Jan 

January 

Thu Jan 19 21:24:52 2012 


年 /1]00 (00-99) 

RH (C01—31) 

日 期 (MM/DD/YY) 

月 日 〈 一 位 数字 前 加 空格 ) (1 一 31》 
ISO 8601 日 期 格式 (YYYY-MM-DD) 
ISO 8601 基于 周 的 年 的 最 后 2 位 数 〈00 一 99) 
ISO 8601 基于 周 的 年 

与 $b 相同 

小 时 (24 小 时 制 ) (00 一 23) 

小 时 《12 小 时 制 ) COL— 12) 

年 日 (001~366) 

月 (01—12) 


20 

19 
01/19/12 
19 
2012-01-19 
12 

2012 

Jan 

21 

09 


01 


分 (00—59) 24 


换行 符 
AM/PM PM 


本 地 时 间 (12 小 时 制 》 09:24:52 PM 
与 “%H:%M” 相 同 21:24 

Ph. [00-60] 52 
水 平 制 表 符 

与 “%$H:g%M:sS” 相 同 

ISO 8601 JL (Monday=1, 1—7) 
星期 日 周 数 : (00~53) 

ISO 8601 AAR: (01—53) 

周 几 : (0=Sunday, 0—6) 
星期 一 周 数 : (00—53) 

本 地 日 期 01/19/12 
本 地 时 间 21:24:52 
年 的 最 后 两 位 数字 (00—99) 12 

年 2012 

ISO 8601 格式 的 UTC 偏 移 量 -0500 

时 区 名 EST 
翻译 为 1 个 % % 


6-10 strftime 的 转换 说 明 
图 中 第 3 列 的 数据 来 自 于 在 Mac OS X 中 执行 strftime 国 数 所 得 的 结果 ， 它 对 应 的 时 间 和 


21:24:52 
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日 期 是 : Thu Jan 19 21:24:52 EST 2012. 
图 6-10 中 的 大 多 数 格式 说 明 的 意义 很 明显 。 需 要 略 做 解释 的 是 sU、sV Mew. SU 是 相 


应 日 期 在 该 年 中 所 属 周 数 ， 包 含 该 年 中 第 一 个 星期 日 的 周 是 第 -- 周 。sW 也 是 相应 日 期 在 该 


年 中 所 属 的 周 数 ， 不 同 的 是 包含 第 一 个 星期 一 的 周 为 第 一 周 。sYV 说 明 符 则 与 上 述 两 者 有 较 
大 区 别 。 如 果 包 含 了 1 月 1 日 的 那 一 周 包含 了 新 一 年 的 4 天 或 更 多 天 , 那么 该 周 是 一 年 中 的 
第 一 周 ， 否 则 该 周 被 认为 是 上 一 年 的 最 后 一 周 。 在 这 两 种 情况 下 ， 周 一 都 被 视 作 每 周 的 第 
= 大 

同 printf —fÉ, strftime 对 某 些 转换 说 明 支 持 修 饰 符 。 可 以 使 用 E A o 修饰 符 产 生 本 地 
支持 的 另 一 种 格式 。 


某 些 系统 对 strftime 的 format 字符 串 提 供 另 一 些 非 标准 的 扩充 支持 。 


^w _ 实 例 


6-11 演示 了 如 何 使 用 本 章 中 讨论 的 多 个 时 间 函 数 。 特 别 演 示 了 如 何 使 用 strftime 打印 
包含 当前 日 期 和 时 间 的 字符 串 。 


#include <stdio.h> 
#include <stdlib.h> 
#include <time.h> 


int 

main (void) 

{ 
time_t t; 
struct tm *tmp; 
char buf1[16]; 
char buf2[64]; 


time(&t); 

tmp = localtime(&t); 

if (strftime(bufl, 16, "time and date: $r, $a $b £d, bY", tmp) == 0) 
printf("buffer length 16 is too smali\n"}; 

else 
printf ("%s\n", bufi)? 

if (strftime(buf2, 64, "time and date: $r, ta tbh td, $Y", tmp) == 0) 
printf ("buffer length 64 is too small\n"); 

else 
printf ("ts\n", buf2); 

exit (0); 


6-11 使 用 strftime 函数 
回顾 图 6-9 中 的 不 同时 间 函 数 的 关系 。 在 以 人 们 可 读 的 格式 打印 时 间 之 前 ， 需 要 获取 时 间 并 
将 其 转换 成 分 解 的 时 间 结 构 。 图 6-11 程序 的 输出 如 下 ; 


$ ./a.out 
buffer length 16 is too small 
time and date: 11:12:35 PM, Thu Jan 19, 2012 


strptime BME strftime 的 反 过 来 版 本 ， 把 字符 串 时 间 转 换 成 分 解 时 间 。 
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#include «time.h» 


char *strptime(const char *restrict buf, const char *restrict format, 


struct tm *restrict fmpir):; 


返回 值 ， 指 向 上 次 解析 的 字符 的 下 一 个 字符 的 指针 ; 否则， 返回 NULL 


format 参数 给 出 了 buf 参数 指向 的 缓冲 区 内 的 字符 串 的 格式 。 虽 然 与 strftime 函数 的 说 明 
稍 有 不 同 ， 但 格式 说 明 是 类 似 的 。strptime 函数 转换 说 明 符 列 在 图 6-12 F. 





缩写 的 或 完整 的 周 日 名 
与 $a 相同 
缩写 的 或 完整 的 月 名 
与 $b 相同 

日 期 和 时 间 

年 的 最 后 两 位 数字 

月 日 : [01-31] 

日 期 [MM/DD/YY] 

530 相同 

与 $b 相间 

小 时 《24 小 时 制 ): [00-23] 
小 时 《12 小 时 制 ): [01-12] 
年 日 : [001-366] 


本 地 时 间 ; C12 小 时 制 ) 
与 “%H:%M” 相 同 

秒 : [00-60] 

任何 空白 

455 “3H:3M:%S” A 
星期 日 周 数 ，[00-53] 
周 日 : [0=Sunday, 0-6] 
星期 一 周 数 : [00-53] 
本 地 日 期 

本 地 时 间 

年 的 最 后 两 位 数字 : [00-99] 
年 

翻译 为 1 个 % 


W 6-12 strptime 函数 的 转换 说 明 
我 们 曾 在 前 面 提 及 ， 图 6-9 中 以 虚线 表示 的 3 个 函数 受到 环境 变量 TZ 的 影响 。 这 3 个 函数 
E localtime, mktime 和 strftime。 如 果 定 义 了 TzZ， 则 这 些 函 数 将 使 用 其 值 代替 系统 默认 
时 区 。 如 果 T2z 定义 为 空 串 ( 即 TZ=), 则 使 用 协调 统一 时 间 UTC. TZ 的 值 常常 类 似 于 TZ=EST5EDT， 
{A POSIX. 允许 更 详细 的 说 明 。 有 关 Tz 变量 的 详细 情况 ， 请 参阅 Single UNIX Specification 
[Open Group 2010] 中 的 环境 变量 章节 。 


关于 Tz 环境 变量 的 更 多 信息 可 参见 手册 页 tzset(3)。 
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6.11 小 结 


所 有 UNIX 系统 都 使 用 口令 文件 和 组 文件 。 我 们 说 明了 读 这 些 文件 的 各 种 函数 。 本 章 也 介绍 
了 阴影 口令 ， 它 可 以 增加 系统 的 安全 性 。 附 属 组 ID 提供 了 一 个 用 户 同时 可 以 参加 多 个 组 的 方法 。 
我 们 还 介绍 了 大 多 数 系统 所 提供 的 访问 其 他 与 系统 有 关 数 据 文件 的 类 似 函 数 。 我 们 讨论 了 几 个 
POSIX.1 的 系统 标识 函数 ， 应 用 程序 使 用 它们 以 标识 它 在 何 种 系统 上 运行 。 最 后 ， 说 明了 ISO C 
和 Single UNIX Specification 提供 的 与 时 间 和 日 期 有 关 的 一 些 函 数 。 


习题 


6.1 ”如果 系统 使 用 阴影 文件 ， 那 么 如 何 取得 加 密 口 令 ? 

6.2 ”假设 你 有 起 级 用 户 权限 ， 并 且 系 统 使 用 了 阴影 口令 ， 重 新 考虑 上 一 道 习题 。 

6.3 ”编写 一 程序 ， 它 调用 uname 并 输出 ut sname 结构 中 的 所 有 字段 ， 将 该 输出 与 uname(1) 命 
令 的 输出 结果 进行 比较 。 

64 HTH time t 数据 类 型 表示 的 最 近 时 间 。 如 果 超 出 了 这 一 时 间 将 会 如 何 ? 

6.5 ”编写 一 程序 ， 获 取 当 前 时 间 ， 并 使 用 strftime 将 输出 结果 转换 为 类 似 于 date(1) 命 令 的 
默认 输出 。 将 环境 变量 TZ 设置 为 不 同 值 ， 观 察 输出 结果 。 
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7.1 引言 


下 一 章 将 介绍 进程 控制 原 语 ， 在 此 之 前 需 先 了 解 进 程 的 环境 。 本 章 中 将 学 习 : 当 程 序 执行 时 ， 其 
main 函数 是 如 何 被 调用 的 ; 命令 行 参数 是 如 何 传递 给 新 程序 的 ， 典 型 的 存储 空间 布局 是 什么 样式 ; 
如 何 分 配 另 外 的 存储 空间 ， 进 程 如 何 使 用 环境 变量 ， 进 程 的 各 种 不 同 终止 方式 等 。 另 外 ， 还 将 说 明 
longjmp 和 setjmp 函数 以 及 它们 与 栈 的 交互 作用 。 本 章 结束 之 前 ， 还 将 查看 进程 的 资源 限制 。 


7.2 main wi 


C 程序 总 是 从 main 函数 开始 执行 。main 函数 的 原型 是 ; 
int main(int argc, char *argvil); 


K+, argc 是 命令 行 参数 的 数目 ，argy 是 指向 参数 的 各 个 指针 所 构成 的 数组 。7.4 节 将 对 命令 行 
参数 进行 说 明 。 

当 内 核 执行 C 程序 时 (使 用 一 个 exec 函数 ，8.10 节 将 说 明 exec 函数 )， 在 调用 main 前 先 
调用 一 个 特殊 的 启动 例 程 。 可 执行 程序 文件 将 此 启动 例 程 指定 为 程序 的 起 始 地 址 一 一 这 是 由 连接 
编辑 器 设置 的 , 而 连接 编辑 器 则 由 C 编译 器 调用 。 启动 例 程 从 内 核 取 得 命令 行 参数 和 环境 变量 值 ， 

然后 为 按 上 述 方式 调用 main 函数 做 好 安排 。 


7.3 ”进程 终止 


有 8 种 方式 使 进程 终止 〈termination)， 其 中 5 种 为 正常 终止 ， 它 们 是 : 
(1) M main 返回 ; 

(2) 调用 exit: 

(3) 调用 exit 或 Exit; 

(4) 最 后 一 个 线程 从 其 启动 例 程 返回 《11.5 55: 

(5) 从 最 后 一 个 线程 调用 pthread_exit (11.5 节 )。 

异常 终止 有 3 种 方式 ， 它 们 是 : 

(6) 调用 abort (10.17 155; 

(7) 接 到 一 个 信号 (021); 

(8) 最 后 一 个 线程 对 取消 请 求 做 出 响应 〈11.5 PA 12.7 节 )。 
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在 第 11 章 和 第 12 章 讨 论 线程 之 前 ， 我 们 暂 不 考虑 专门 针对 线程 的 3 种 终止 方式 。 


上 节 提 及 的 启动 例 程 是 这 样 编写 的 ， 使 得 从 main 返回 后 立即 调用 exit 函数 。 如 果 将 启动 例 
程 以 C 代码 形式 表示 实际 上 该 例 程 常常 用 汇编 语言 编写 )， 则 它 调 用 main 函数 的 形式 可 能 是 ， 
exit(main(argc, argv)); 
1. 退出 函数 
3 个 函数 用 于 正常 终止 一 个 程序 ，_exit Hl Exit 立即 进入 内 核 ，exit 则 先 执行 一 些 清理 
处 理 ， 然 后 返回 内 核 。 
#include <stdlib.h> 
void exit(int status) ; 
void _Exit (int status) ; 


#include <unistd.h> 


void _exit {int status); 





我 们 将 在 8.5 节 中 讨论 这 3 个 函数 对 其 他 进程 (如 正在 终止 进程 的 父 进程 和 子 进程 ) 的 影响 。 
| 使 用 不 同 头 文件 的 原因 是 exit 和 _Exit 是 由 ISO C 说 明 的 ,而 _exit 是 由 POSIX.1 说 明 的 。 


由 于 历史 原因 ，exit 函数 总 是 执行 一 个 标准 VO 库 的 清理 关闭 操作 :对 于 所 有 打开 流 调用 
fclose ARM. [mMZ 5.5 节 ， 这 造成 输出 缓冲 中 的 所 有 数据 都 被 冲洗 〈 写 到 文件 上 )。 

3 个 退出 函数 都 带 一 个 整 型 参数 ， 称 为 终止 状态 〈 或 退出 状态 ，exit status)。 大 多 数 UNIX 系 
统 shell 都 提供 检查 进程 终止 状态 的 方法 。 如 果 (a) 调用 这 些 函 数 时 不 带 终止 状态 , 或 (b) main 
执行 了 一 个 无 返回 值 的 return 语句 , 或 (c) main 没有 声明 返回 类 型 为 整 型 ， 则 该 进程 的 终止 
状态 是 未 定义 的 。 但 是 , 若 main 的 返回 类 型 是 整 型 , HE main 执行 到 最 后 一 条 语句 时 返回 CER 
式 返 回 )， 那 么 该 进程 的 终止 状态 是 0。 


这 种 处 理 是 ISO C 标准 1999 版 引入 的 。 历 史上 ， 若 main 函 教 终止 时 没有 显 式 使 用 Teturn 
| 语句 或 调用 exit 通 数 ， 那 么 进程 终止 状态 是 未 定义 的 。 
main 函数 返回 一 个 整 型 值 与 用 该 值 调用 exit 是 等 价 的 。 于 是 在 main 函数 中 
exit(0); 
等 价 于 


return (0); 


xh 
7-1 中 的 程序 是 经 上 典 的 “hello, world" XH. 


#include «stdio.h» 
main() 
{ 
printf ("hello, world\n"); 


图 7-1 经 典 C 程序 
对 该 程序 进行 编译 ， 然 后 运行 ， 则 可 见 到 其 终止 码 是 随机 的 。 如 果 在 不 同 的 系统 上 编译 该 程 
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序 ， 我 们 很 可 能 得 到 不 同 的 终止 码 ， 这 取决 于 main 函数 返回 时 栈 和 寄存 器 的 内 容 : 


$ gcc hello.c 
$ ./a.out 


hello, world 
$ echo $? 打印 终止 状态 


现在 ， 我 们 启用 1999 ISO C 编译 器 扩展 ， 则 可 见 到 终止 码 改变 了 : 


$ gee -stdzc99 hello.c 启用 gcc 的 1999 ISO C 扩展 
hello.c:4: warning: return type defaults to 'int' 

$ ./a.out 

hello, world 

$ echo $? 打印 终止 状态 


0 


| AŠ, SANAM 1999 ISO C 扩展 时 ,编译 器 发 出 警告 消息 。 打 印 该 警告 消息 的 原因 是 : main 
| 函数 的 类 型 没有 显 式 地 声明 为 整 型 。 如 果 我 们 增加 了 这 一 声明 ， 那 么 此 警告 消息 就 不 会 出 现 。 但 
， 是 ， 如 果 我 们 使 编译 器 所 推荐 的 警告 消息 都 起 作用 ( 使 用 -Wall 标志 ), 则 可 能 见 到 类 似 于 “control 
reaches end of nonvoid function." ( 控制 到 达 非 void 函数 的 旦 端 ) 这 样 的 警告 消息 。 

将 main 声明 为 返回 整 型 ， 但 在 main BRAAA exit 代替 return, HE C 编译 器 和 
UNIX 1int(1) 程 序 而 言 会 产生 不 必要 的 警告 信息 ， 因 为 这 些 编译 器 并 不 了 解 main 中 的 exit 与 
return 语句 的 作用 相同 。 避 开 这 种 警告 信息 的 一 种 方法 是 在 main 中 使 用 return 语句 而 不 是 
exit。 介 是 这 样 做 的 结果 是 不 能 用 UNIX 的 grep 实用 程序 来 找 出 程序 中 所 有 的 exit AA. F 
一 个 解决 方法 是 将 main 说 明 为 返回 void 而 不 是 int, 然后 仍然 调用 exito 这样 做 可 以 避免 编 
译 器 的 敬告， 但 从 程序 设计 角度 看 却 并 不 正确 ， 而 且 会 产生 其 他 的 编译 警告 ， 因 为 main 的 返回 
类 型 应 当 是 带 符号 整 型 。 本 章 将 main 表示 为 返回 整 型 ， 因 为 这 是 SOC 和 POSIX.1 所 定义 的 。 

不 同 的 编译 器 产生 警告 消息 的 详细 程度 是 不 一 样 的 。 除 非 使 用 警告 选项 , 否则 GNU C 编译 器 
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不 会 发 出 不 必要 的 警告 消息 。 "T 
下 一 章 我 们 将 了 解 进 程 如 何 造成 程序 被 执行 ， 如 何等 待 进程 完成 ， 然 后 又 如 何 获 取 其 终 E IER. 
2. He atexit 


按照 ISO C 的 规定 ， 一 个 进程 可 以 登记 多 至 32 个 函数 ， 这 些 函 数 将 由 exit 自动 调用 。 我们 
称 这 些 函 数 为 终止 处 理 程 序 Cexit handler)， 并 调用 atexit 函数 来 登记 这 些 函 数 。 
#include <stdlib.h> 


int atexit(void (*func) (void)); 





A: FRH., JO: 若 出 错 ， 返 回 非 0 


其 中 ，atexit 的 参数 是 一 个 函数 地 址 ， 当 调用 此 函数 时 无 需 向 它 传递 任何 参数 ， 也 不 期 户 
它 返 回 一 个 值 。exit 调用 这 些 函 数 的 顺序 与 它们 登记 时 候 的 顺序 相反 。 同 一 函数 如 若 登 记 多 次 ， 
也 会 被 调用 多 次 。 


终止 处 理 程序 这 一 机 制 是 由 ANSI C 标准 于 1989 年 引入 的 。 早 于 ANSI C 的 系统 ， 如 SVR3 
:和 4.3B8SD， 都 不 提供 这 种 终止 处 理 程序 。 
| ISOC 要 求 ， 系 统 至 少 应 支持 32 个 终止 处 理 程序 ， 但 实现 经 常会 提 供 更 多 的 支持 (参见 图 2.15 )。 
”为 了 确定 一 个 给 定 的 平台 支持 的 最 大 终止 处 理 程序 数 ， 可 以 使 用 sysconf 函数 (如 图 2-14 所 示 ), 
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根据 ISO C 和 POSIX.1, exit 首先 调用 各 终止 处 理 程序 ， 然后 关闭 (通过 fclose) 所 有 打 
开 流 。POSIX.1 扩展 了 ISO C 标准 ， 它 说 明 ， 如 车 程序 调用 exec 函数 族 中 的 任 一 函数 ， 则 将 清 
除 所 有 已 安装 的 终止 处 理 程 序 . 图 7-2 显示 了 一 个 C 程序 是 如 何 启 动 的 , 以 及 它 终止 的 各 种 方式 。 





图 7-2 一 个 C 程 序 是 如 何 启动 和 终止 的 
注意 ， 内 核 使 程序 执行 的 唯一 方法 是 调用 一 个 exec 函数 。 进 程 自 愿 终止 的 唯一 方法 是 显 式 或 
隐 式 地 〈 通 过 调用 exit) 调用 exit 或 Exit。 进 程 也 可 非 自愿 地 由 一 个 信号 使 其 终止 (图 7-2 
中 没有 显示 )。 


* 实例 
7-3 的 程序 说 明 如 何 使 用 atexit 函数 。 


#include "apue.h" 





static void my exitlí(void); 
static void my exit2(void); 


int 
main (void) 
{ 
if (atexit(my exit2) != 0) 
err sys("can't register my exit2"); 


if (atexit(my exitl) !- 0) 
err sys("can't register my exitl1"); 
if (atexit(my exitl) != 0) 


err sys("can't register my exitl1"); 
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} 


printf ("main is done\n"); 
return (0); 


static void 
my_exitl (void) 


{ 


} 


printf ("first exit handler\n"); 


static void 
my_exit2 (void) 


{ 


} 


printf ("second exit handler\n")}; 


7-3 ”终止 处 理 程序 实例 
执行 该 程序 产生 : 


$ ./a.out 

main is done 

first exit handler 
first exit handler 
second exit handler 


终止 处 理 程序 每 登记 一 次 ， 就 会 被 调用 一 次 。 在 图 7-3 的 程序 中 ， 第 一 个 终止 处 理 程序 被 登 


记 两 次 ， 所 以 也 会 被 调用 两 次 。 注 意 ， 在 main 中 没有 调用 exit， 而 是 用 了 return 语句 。 w^ 


7.4 命令 行 参数 


当 执 行 一 个 程序 时 ， 调 用 exec 的 进程 可 将 命令 行 参数 传递 给 该 新 程序 。 这 是 UNIX shell 的 


一 部 分 常规 操作 。 在 前 几 章 的 很 多 实例 中 ， 我 们 已 经 看 到 了 这 一 点 。 
下 实例 


7-4 所 示 的 程序 将 其 所 有 命令 行 参数 都 回 显 到 标准 输出 上 。 注 意 ， 通 常 的 echo(1) 程 序 不 


回 显 第 0 个 参数 。 


finclude "apue.h" 


int 


main(int argc, char *argv[]? 


{ 


int 1; 

for (i = 0; i < argc; i++) /* echo all command-line args */ 
printf ("argv(%d]: s\n", i, argv[i]); 

exit (0); 


图 7-4 将 所 有 命令 行 参数 回 显 到 标准 输出 
编译 此 程序 ， 并 将 可 执行 代码 文件 命名 为 echoarg, RGF: 


76 C 程序 的 存储 空间 布局 163 


$ ./echoarg argl TEST foo 
argv[0]: ./echoarg 
argv[11]: argl 

argv[2]: TEST 

argv(3]: foo 


ISO C Al POSIX.1 都 要 求 argv large] 是 一 个 空 指针 。 这 就 使 我 们 可 以 将 参数 处 理 循 环 改 写 为 : 


for (i = 0; argv[i] != NULL; i++) u 


7.5 IRR 


每 个 程序 都 接收 到 一 张 环境 表 。 与 参数 表 一 样 ， 环 境 表 也 是 一 个 字符 指针 数组 ， 其 中 每 个 指 
针 包 含 一 个 以 null 结束 的 C 字符 串 的 地 址 。 全 局 变量 environ 则 包含 了 该 指针 数组 的 地 址 ;: 
extern char **environ; 
例如 ， 如 果 该 环境 包含 5 个 字符 串 ， 那 么 它 看 起 来 如 图 7-5 中 所 示 。 其 中 ， 每 个 字符 串 的 结尾 处 
都 显 式 地 有 一 个 null 字 节 。 我们 称 environ 为 环境 指针 《environment pointer)， 指 针 数 组 为 环境 
表 ， 其 中 各 指针 指向 的 字符 串 为 环境 字符 串 。 
环境 指针 环境 表 TIRE IF 


environ: HOME=/home/sar\0 
PATH=: /bin:/usr/bin\0 
SHELL=/bin/bash\0 
USER=sar\0 


LOGNAME=sar\0 


7-5 由 5 个 字符 串 组 成 的 环境 

按照 惯例 ， 环 境 由 

name = value 
这 样 的 字符 串 组 成 ， 如 图 7-5 中 所 示 。 大 多 数 预定 义 名 完全 由 大 写字 母 组 成 ， 但 这 只 是 一 个 惯例 。 

在 历史 上 , 大 多 数 UNIX 系统 支持 main 函数 带 3 个 参数 , 其 中 第 3 个 参数 就 是 环境 表 地 址 : 

int main(int arge, char *argv[], char *envp[]); 
因为 ISO C 规定 main KARANDE, du HS 3 个 参数 与 全 局 变量 environ 相 比 也 没有 带 
来 更 多 益处 ， 所 以 POSIX.1 也 规定 应 使 用 environ 而 不 使 用 第 3 个 参数 。 通 常用 getenv 和 
putenv 函数 〈 见 7.9 45) 来 访问 特定 的 环境 变量 ， 而 不 是 用 environ 变量 。 但 是 ， 如 果 要 查看 
整个 环境 ， 则 必须 使 用 environ 指针 。 


7.6 _C 程序 的 存储 空间 布局 


历史 沿袭 至 今 ，C 程序 一 直 由 下 列 几 部 分 组 成 : 
。 正文 段 。 这 是 由 CPU 执行 的 机 器 指令 部 分 。 通 常 ， 正 文 段 是 可 共享 的 ， 所 以 即使 是 频繁 
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7-6 显示 了 这 些 段 的 一 种 典型 安排 方式 。 这 是 程 
序 的 逻辑 布局 ， 虽 然 并 不 要 求 一 个 具体 实现 一 定 以 这 种 


执行 的 程序 (如 文本 编辑 器 、C 编译 器 和 shell 等 ) 在 存储 器 中 也 只 需 有 一 个 副本 ， 另 外 ， 
正文 段 常常 是 只 读 的 ， 以 防止 程序 由 于 意外 而 修改 其 指令 。 

初始 化 数据 段 。 通 常 将 此 段 称 为 数据 段 ， 它 包含 了 程序 中 需 明 确 地 赋 初 值 的 变量 。 例 如 ， 
C 程序 中 任何 函数 之 外 的 声明 : 


int maxcount - 99; 


使 此 变量 以 其 初 值 存放 在 初始 化 数据 段 中 。 

未 初始 化 数据 段 。 通 常 将 此 段 称 为 bss 段 ， 这 一 名 称 来 源 于 早期 汇编 程序 一 个 操作 符 ， 意 
思 是 “由 符号 开始 的 块 ”(block started by symbol)， 在 程序 开始 执行 之 前 ， 内 核 将 此 中 中 
的 数据 初始 化 为 0 或 空 指针 。 函 数 外 的 声明 : 


long sum[(1000]; 


使 此 变量 存放 在 非 初始 化 数据 段 中 。 

栈 。 自 动 变 量 以 及 每 次 函数 调用 时 所 需 保存 的 信 
息 都 存放 在 此 段 中 。 每 次 函数 调用 时 ， 其 返回 地 
址 以 及 调用 者 的 环境 信息 (如 某 些 机 器 寄存 器 的 
值 ) 都 存放 在 栈 中 。 然 后 ， 最 近 被 调用 的 函数 在 
栈 上 为 其 自动 和 临时 变量 分 配 存储 空间 。 通过 以 
这 种 方式 使 用 栈 ，C 递归 函数 可 以 工作 。 递 归 函 
数 每 次 调用 自身 时 ， 就 用 一 个 新 的 栈 帧 ， 因 此 一 
次 函数 调用 实例 中 的 变量 集 不 会 影响 另 一 次 函 
数 调用 实例 中 的 变量 。 

堆 。 通 常 在 堆 中 进行 动态 存储 分 配 。 由 于 历史 上 形 
成 的 惯例 ， 堆 位 于 未 初始 化 数据 段 和 栈 之 间 。 





方式 安排 其 存储 空间 ， 但 这 是 一 种 我 们 便于 说 明 的 典型 图 7-6 典型 的 存储 空间 安排 
安排 。 对 于 32 位 Intel x86 处 理 器 上 的 Linux， 正 文 段 从 0x08048000 单元 开始 ， 栈 底 则 在 
0xC0000000 之 下 开始 (在 这 种 特定 结构 中 ， 栈 从 高 地 址 向 低地 址 方向 增长 )。 堆 顶 和 栈 顶 之 间 
未 用 的 虚 地 址 空间 很 大 。 


a.out 中 还 有 若 于 其 他 类 型 的 段 ， 如 包含 符号 表 的 段 、 包 含 调试 信息 的 段 以 及 包含 动态 共享 
' 库 链 接 表 的 段 等 。 这 些 部 分 并 不 效 载 到 进程 执行 的 程序 映像 中 。 


从 图 7-6 还 可 注意 到 ， 未 初始 化 数据 段 的 内 容 并 不 存放 在 磁盘 程序 文件 中 。 其 原因 是 ， 内 核 
在 程序 开始 运行 前 将 它们 都 设置 为 0。 需 要 存放 在 磁盘 程序 文件 中 的 段 只 有 正文 段 和 初始 化 数 


据 段 。 


size(1) 命 令 报 告 正文 段 、 数 据 段 和 bss 段 的 长 度 〈 以 字 节 为 单位 )。 例 如 : 


$ size /usr/bin/cc /bin/sh 


text data bss dec hex filename 


346919 3576 6680 357175 57337 /usr/bin/cc 
102134 1776 11272 115182  1clee  /bin/sh 


第 4 列 和 第 5 列 是 分 别 以 十 进 制 和 十 六 进 制 表示 的 3 段 总 长 度 。 
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7.7 共享 库 


现在 ， 大 多 数 UNIX 系统 支持 共享 库 。Amold[1986] 说 明了 System V 上 共享 库 的 一 个 早期 实 
W. Gingell 等 [1987] 则 说 明了 SunOS 上 的 另 一 个 实现 。 共 享 库 使 得 可 执行 文件 中 不 再 需要 包含 公 
用 的 库 函 数 ， 而 只 需 在 所 有 进程 都 可 引用 的 存储 区 中 保存 这 种 库 例 程 的 一 个 副本 。 程 序 第 一 次 执 
行 或 者 第 一 次 调用 某 个 库 函 数 时 ， 用 动态 链接 方法 将 程序 与 共享 库 函 数 相 链接 。 这 减少 了 每 个 可 
执行 文件 的 长 度 ， 但 增加 了 一 些 运 行 时 间 开 销 。 这 种 时 间 开 销 发 生 在 该 程序 第 一 次 被 执行 时 ， 或 
者 每 个 共享 库 函 数 第 一 次 被 调用 时 。 共 享 库 的 另 一 个 优点 是 可 以 用 库 函 数 的 新 版 本 代替 老 版 本 而 
无 需 对 使 用 该 库 的 程序 重新 连接 编辑 〈 假 定 参 数 的 数目 和 类 型 都 没有 发 生 改 变 )。 

在 不 同 的 系统 中 ， 程 序 可 能 使 用 不 同 的 方法 说 明 是 否 要 使 用 共享 库 。 比 较 典 型 的 有 cc(1) 和 
1d(1) 命 令 的 选项 。 作 为 长 度 方面 发 生变 化 的 例子 ， 先 用 无 共享 库 方式 创建 下 列 可 执行 文件 (典型 
的 hello.c 程序 ): 


$ gcc -static hellol.c 阻止 gcc 使 用 共享 库 
$ ls -1 a.out 
-rwxrwxr-x 1 sar 879443 Sep 2 10:39 a.out 
$ size a.out 
text data bss dec hex filename 


787775 6128 11272 805175  c4937 a.out 


如 果 再 使 用 共享 库 编 译 此 程序 ， 则 可 执行 文件 的 正文 和 数据 段 的 长 度 都 显著 减 小 


$ gcc hellol.c gcc 默认 使 用 共享 库 

$ 1s -1 a.out 

-rwxrwxr-x 1 sar 8378 Sep 2 10:39 a.out 

$ size a.out 
text data bss dec hex filename 
1176 504 16 1696 6a0 a.out 


7.8 存储 空间 分 配 


ISO C 说 明了 3 个 用 于 存储 空间 动态 分 配 的 函数 。 

(D malloc， 分 配 指定 字 节 数 的 存储 区 。 此 存储 区 中 的 初始 值 不 确定 。 

(2) calloc， 为 指定 数量 指定 长 度 的 对 象 分 配 存储 空间 。 该 空间 中 的 每 一 位 〈bit) 都 初始 
化 为 0。 

(3) realloc， 增加 或 减少 以 前 分 配 区 的 长 度 。 当 增加 长 度 时 ， 可 能 需 将 以 前 分 配 区 的 内 容 
移 到 另 一 个 足够 大 的 区 域 ， 以 便 在 尾 端 提供 增加 的 存储 区 ， 而 新 增 区 域内 的 初始 值 则 不 确定 。 


dinclude <stdlib.h> 
void *malloc(í(size t size); 
void *calloc(size t nobj, size t size); 


void *realloc(void “pir, size t newsize); 


3 个 函数 返回 值 : 若 成 功 ， 返 回 非 空 指针 ， 若 出 错 ， 返 回 NULL 





void free(void “pir); 


这 3 个 分 配 函 数 所 返回 的 指针 一 定 是 适当 对 齐 的 ， 使 其 可 用 于 任何 数据 对 象 。 例 如 ， 在 一 个 
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特定 的 系统 上 ， 如 果 最 苛刻 的 对 齐 要 求 是 ，double 必须 在 8 的 倍数 地 址 单元 处 开始 ， 那 么 这 3 
个 函数 返回 的 指针 都 应 这 样 对 齐 。 

因为 这 3 个 alloc 函数 都 返回 通用 指针 void *， 所 以 如 果 在 程序 中 包括 了 #include 
<stdlib.h> (以 获得 函数 原型 )， 那 么 当 我 们 将 这 些 函 数 返回 的 指针 赋予 一 个 不 同类 型 的 指针 时 ， 就 
不 需要 显 式 地 执行 强制 类 型 转换 。 未 声明 函数 的 默认 返回 值 为 int， 所 以 使 用 没有 正确 函数 声明 的 强制 
类 型 转换 可 能 会 隐藏 系统 错误 ， 因 为 int 类 型 的 长 度 与 函数 返回 类 型 值 的 长 度 不 同 〈 本 例 中 是 指针 )。 

HE free 释放 ptr 指向 的 存储 空间 。 被 释放 的 空间 通常 被 送 入 可 用 存储 区 池 ， 以 后 ， 可 在 
调用 上 述 3 个 分 配 函 数 时 再 分 配 。 

realloc 函数 使 我 们 可 以 增 、 减 以 前 分 配 的 存储 区 的 长 度 ( 最 常见 的 用 法 是 增加 该 区 )。 例 
如 ， 如 果 先 为 一 个 数组 分 配 存储 空间 ， 该 数组 长 度 为 512， 然 后 在 运行 时 填充 它 ， 但 运行 一 段 时 
间 后 发 现 该 数组 原先 的 长 度 不 够 用 ， 此 时 就 可 调用 realloc 扩充 相应 存储 空间 。 如 果 在 该 存储 
区 后 有 足够 的 空 闻 可 供 扩充 ， 则 可 在 原 存 储 区 位 置 上 向 高 地 址 方向 扩充 ， 无 需 移动 任何 原先 的 内 
容 ， 并 返回 与 传 给 它 相 同 的 指针 值 。 如 果 在 原 存 储 区 后 没有 足够 的 空间 ， 则 realloc 分 配 男 一 
个 足够 大 的 存储 区 ， 将 现存 的 512 个 元 素数 组 的 内 容 复 制 到 新 分 配 的 存储 区 。 然 后 ， 释 放 原 存储 
区 ， 返 回 新 分 配 区 的 指针 。 因 为 这 种 存储 区 可 能 会 移动 位 置 , 所 以 不 应 当 使 任何 指针 指 在 该 区 中 。 
习题 4.16 和 图 C-3 显示 了 在 getcwd 中 如 何 使 用 realloc, 以 处 理 任何 长 度 的 路 径 名 。 图 17-27 
的 程序 是 使 用 realloc 的 另 一 个 例子 ， 用 其 可 以 避免 使 用 编译 时 固定 长 度 的 数组 。 

注意 ，realloc 的 最 后 一 个 参数 是 存储 区 的 新 长 度 ， 不 是 新 、 旧 存储 区 长 度 之 差 。 作 为 一 个 特例 ， 
# pr 是 一 个 空 指针 , W realloc 的 功能 与 malloc 相同 , 用 于 分 配 一 个 指定 长 度 为 newsize 的 存储 区 。 


| 这 些 函 数 的 早期 版 本 允许 调用 realloc 分 配 自 上 次 malloc, realloc 或 calloc 调用 以 
: 来 所 释放 的 块 。 这 种 技巧 可 回溯 到 V7， 它 利用 malloc 的 搜索 策略 ， 实 现存 储 器 紧缩 。Solaris 
” 仍 支 持 这 一 功能 ， 而 很 多 其 他 平台 则 不 支持 。 这 种 功能 不 被 赞同 ， 不 应 再 使 用 。 


这 些 分 配 例 程 通常 用 sbrk(2) 系 统 调用 实现 。 该 系统 调用 扩充 (或 缩小 ) 进程 的 堆 ( 见 图 7-6)。 
malloc 和 free 的 一 个 样 例 实现 请 见 Kernighan 和 Ritchie({1988]AY 8.7 节 。 

虽然 sbrk 可 以 扩充 或 缩小 进程 的 存储 空间 ， 但 是 大 多 数 malloc 和 free 的 实现 都 不 减 小 
进程 的 存储 空间 。 释 放 的 空间 可 供 以 后 再 分 配 ， 但 将 它们 保持 在 malloc 池 中 而 不 返回 给 内 核 。 

大 多 数 实现 所 分 配 的 存储 空间 比 所 要 求 的 要 稍 大 一 些 ， 额 外 的 空间 用 来 记录 管理 信息 一 一 分 
配 块 的 长 度 、 指 向 下 一 个 分 配 块 的 指针 等 。 这 就 意味 着 ， 如 果 超 过 一 个 已 分 配 区 的 尾 端 或 者 在 已 
分 配 区 起 始 位 置 之 前 进行 写 操 作 ， 则 会 改写 另 一 块 的 管理 记录 信息 。 这 种 类 型 的 错误 是 灾难 性 的 ， 
但 是 因为 这 种 错误 不 会 很 快 就 暴露 出 来 ， 所 以 也 就 很 难 发 现 。 

在 动态 分 配 的 缓冲 区 前 或 后 进行 写 操作 ， 破 坏 的 可 能 不 仅仅 是 该 区 的 管理 记录 信息 。 在 动态 
分 配 的 缓冲 区 前 后 的 存储 空间 很 可 能 用 于 其 他 动态 分 配 的 对 象 。 这 些 对 象 与 破坏 它们 的 代码 可 能 
无 关 ， 这 造成 寻求 信息 破坏 的 源头 更 加 困难 。 

其 他 可 能 产生 的 致命 性 的 错误 是 ， 释 放 一 个 已 经 释放 了 的 块 ， 调 用 free 时 所 用 的 指针 不 是 
3 个 alloc 函数 的 返回 值 等 。 如 若 一 个 进程 调用 malloc 函数 ， 但 却 忘 记 调用 free MR, MA 
该 进程 占用 的 存储 空间 就 会 连续 增加 ， 这 被 称 为 泄漏 (leakage )。 如 果 不 调用 free 函数 释放 不 再 
使 用 的 空间 ， 那 么 进程 地 址 空间 长 度 就 会 慢 慢 增加 ， 直 至 不 再 有 空闲 空间 。 此 时 ， 由 于 过 度 的 换 
页 开销 ， 会 造成 性 能 下 降 。 

因为 存储 空间 分 配 出 错 很 难 跟 踪 ， 所 以 某 些 系 统 提 供 了 这 些 函数 的 另 一 种 实现 版 本 。 每 次 调 
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用 这 3 个 分 配 函 数 中 的 任意 一 个 或 free 时 ， 它 们 都 进行 附加 的 检 错 。 在 调用 连接 编辑 器 时 指定 
一 个 专用 库 ， 在 程序 中 就 可 使 用 这 种 版 本 的 函数 。 此 外 还 有 公共 可 用 的 资源 ， 在 对 其 进行 编译 时 
使 用 一 个 特殊 标志 就 会 使 附加 的 运行 时 检查 生效 。 


FreeBSD, Mac OS X 以 及 Linux 通过 设置 环境 变量 支持 附加 的 调试 功能 。 另 外 ， 通 过 符号 链 
| ik/etc/malloc.conf 可 将 选项 传递 给 FreeBSD HAF, 


符 代 的 存储 空间 分 配 程序 


有 很 多 可 替代 malloc 和 free 的 函数 。 某 些 系统 已 经 提供 替代 存储 空间 分 配 函 数 的 库 。 另 
一 些 系 统 只 提供 标准 的 存储 空间 分 配 程序 。 如 果 需 要 ， 软 件 开 发 者 可 以 下 载 替代 函数 。 下 面 讨论 
某 些 替代 函数 和 库 。 

1. libmalloc 

基于 SVR4 的 UNIX 系统 ， 如 Solaries， 包 含 了 libmalloc Ë, 它 提供 了 一 套 与 ISO C 存储 
空间 分 配 函 数 相 匹配 的 接口 。1ibmalloc 库 包括 mallopt 函数 ， 它 使 进程 可 以 设置 一 些 变量 ， 
并 用 它们 来 控制 存储 空间 分 配 程序 的 操作 。 还 可 使 用 另 一 个 名 为 mallinfo 的 函数 ， 以 对 存储 空 
间 分 配 程序 的 操作 进行 统计 。 

2. vmalloc 

Vo[1996] 说 明 一 种 存储 空间 分 配 程序 ， 它 多 许 进程 对 于 不 同 的 存储 区 使 用 不 同 的 技术 。 除 了 
一 些 vmalloc 特有 的 函数 外 ， 该 库 也 提供 了 ISO C 存储 空间 分 配 函 数 的 仿真 器 。 

3. quick-fit 

历史 上 所 使 用 的 标准 malloc 算法 是 最 佳 适 配 或 首次 适 配 存 储 分 配 策略 。dquick-fit (R 
IARC) 算法 比 上 述 两 种 算法 快 ， 但 可 能 使 用 较 多 存储 空间 。Weinstock 和 Wulf[1988] 对 该 算法 进 
行 了 描述 ， 该 算法 基于 将 存储 空间 分 裂 成 各 种 长 度 的 缓冲 区 ， 并 将 未 使 用 的 缓冲 区 按 其 长 度 组 成 
不 同 的 空闲 区 列表 。 现 在 许多 分 配 程序 都 基于 快速 适 配 。 

4. jemalloc 209 

jemalloc 函数 实现 是 FreeBSD 8.0 中 的 默认 存储 空间 分 配 程序 ， 它 是 库 函 数 malloc RE 
FreeBSD 中 的 实现 。 它 的 设计 具有 良好 的 可 扩展 性 ， 可 用 于 多 处 理 器 系统 中 使 用 多 线程 的 应 用 程 
序 。Evans[2006] 说 明了 具体 实现 及 其 性 能 评估 。 

5. TCMalloc 

TCMalloc 函数 用 于 替代 malloc EUBUÉKU BEDEESTERE. Br REHAR., WR 
存 中 分 配 缓冲 区 以 及 释放 缓冲 区 到 高 速 缓存 中 时 , 它 使 用 线程 -本 地 高 速 缓存 来 避免 锁 开销 。 它 还 
有 内 置 的 堆 检查 程序 和 堆 分 析 程 序 帮 助 调试 和 分 析 动 态 存储 的 使 用 .TCMalloc 库 是 开源 可 用 的 ， 
是 Google-perftools 工具 中 的 一 个 。Ghemawat 和 Menage[2005] 对 此 做 了 简单 介绍 。 

6. GX alloca 

还 有 一 个 函数 也 值得 一 提 ， 这 就 是 alloca。 它 的 调用 序列 与 mallLoc 相同 ， 但 是 它 是 在 当 
前 函数 的 栈 帧 上 分 配 存储 空间 ， 而 不 是 在 堆 中 。 其 优点 是 : 当 函 数 返 回 时 ， 自 动 释放 它 所 使 用 的 
栈 帧 ， 所 以 不 必 再 为 释放 空间 而 费心 。 其 缺点 是 ， alLloca 函数 增加 了 栈 帧 的 长 度 ， 而 某 些 系统 
在 函数 已 被 调用 后 不 能 增加 栈 帧 长 度 ， 于 是 也 就 不 能 支持 alloca 函数 。 尽 管 如 此 ， 很 多 软件 包 
还 是 使 用 alloca 函数 ， 也 有 很 多 系统 实现 了 该 函数 。 


本 书 中 讨论 的 4 个 平台 都 提供 了 alloca BH, 
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7.9 环境 变量 
如 同 前 述 ， 环 境 字符 串 的 形式 是 : 


name=value 


UNIX 内 核 并 不 查看 这 些 字符 串 ， 它 们 的 解释 完全 取决 于 各 个 应 用 程序 。 例 如 ，shell 使 用 了 大 量 
的 环境 变量 。 其 中 某 一 些 在 登录 时 自动 设置 (如 HOME. USER 等 )， 有 些 则 由 用 户 设 置 。 我 们 通 
常 在 一 个 shel 启动 文件 中 设置 环境 变量 以 控制 shell 的 动作 。 例 如 , 若 设置 了 环境 变量 MAILPATH, 
则 它 告诉 Bourne shell, GNU Bourne-again shell 和 Kom shell 到 哪里 去 查看 邮件 。 

ISO C 定义 了 一 个 函数 getenv， 可 以 用 其 取 环 境 变量 值 ， 但 是 该 标准 又 称 环境 的 内 容 是 由 
实现 定义 的 。 


#include <stdlib.h> 


char *getenv (const char *mame) ; 





返回 值 ， 指 向 与 name 关联 的 value 的 指针 ， 若 未 找到 ， 返 回 NULL 
注意 ， 此 函数 返回 一 个 指针 ， 它 指向 name-value 字符 串 中 的 value。 我 们 应 当 使 用 getenv 
从 环境 中 取 一 个 指定 环境 变量 的 值 ， 而 不 是 直接 访问 environ。 

Single UNIX Specification 中 的 POSIX.1 定义 了 某 些 环境 变量 。 如 果 支 持 XSI 扩展 ， 那 么 其 中 也 
包含 了 另外 一 些 环境 变量 定义 。 图 7-7 列 出 了 由 Single UNIX Specification 定义 的 环境 变量 ,并 指明 本 
书 讨论 的 4 种 实现 对 它们 的 支持 情况 。 由 POSIX.1 定义 的 各 环境 变量 标记 为 *:， 否 则 为 XSI 扩展。 本 
书 讨论 的 4 种 UNIX 实现 使 用 了 很 多 依赖 于 实现 的 环境 变量 。 注 意 ，ISO C 没有 定义 任何 环境 变量 。 


FreeBSD Linux MacOS Solaris : 
2 = A zii 10 


COLUMNS . 


终端 宽度 
DATEMSK XSI 


HOME 
LANG 

LC_ALL 
LC_COLLATE 
LC_CTYPE 
LC_MESSAGES 
LC_MONETARY 
LC_NUMERIC 
LC_TIME 
LINES 
LOGNAME 
MSGVERB 
NLSPATH 
PATH 

PWD 

SHELL 

TERM 
TMPDIR 

TZ 


Ld . * * * + . * e e * 


* * . . * . . 


getdatef(3) 模 板 文件 路 径 名 
home 起 始 目录 

本 地 名 

本 地 名 

本 地 排序 名 

本 地 字符 分 类 名 

本 地 消息 名 

本 地 货币 编辑 名 

本 地 数字 编辑 名 

本 地 日 期 /时 间 格 式 名 

终端 高 度 

登录 名 

fmtmsg(3) 处 理 的 消息 组 成 部 分 
消息 类 模板 序列 

搜索 可 执行 文件 的 路 径 前 缀 列表 
当前 工作 目录 的 绝对 路 径 名 
APF ARR shell 名 

终端 类 型 

在 其 中 创建 临时 文件 的 目录 路 径 名 
时 区 信息 





图 7-7 Single UNIX Specification 定义 的 环境 变量 
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除了 获取 环境 变量 值 ， 有 时 也 需要 设置 环境 变量 。 我 们 可 能 希望 改变 现 有 变量 的 值 ， 或 者 是 
增加 新 的 环境 变量 。( 在 下 一 章 将 会 了 解 到 ， 我 们 能 影响 的 只 是 当前 进程 及 其 后 生成 和 调用 的 任 
何 子 进 程 的 环境 ， 但 不 能 影响 父 进程 的 环境 ， 这 通常 是 一 个 shell 进程 。 尽 管 如 此 ， 修 改 环境 表 的 
能 力 仍然 是 很 有 用 的 。) 遗憾 的 是 ， 并 不 是 所 有 系统 都 支持 这 种 能 力 。 图 7-8 列 出 了 由 不 同 的 标准 
及 实现 支持 的 各 种 函数 。 211 


ISOC POSIX.1 | FreeBSD80 Linux3.2.0 MacOSX 10.6.8 Solaris 10 


a 
putenv 
setenv 
unsetenv 
clearenv 


7-8 ”对 于 各 种 环境 表 函 数 的 支持 
| clearenv #2 Single UNIX Specification 的 组 成 部 分 。 它 被 用 来 删除 环境 表 中 的 所 有 项 。 


在 图 7-8 "P, "PIRE 3 个 函数 的 原型 是 : 


#include <stdlib.h> 





int putenv(char *sir); 
函数 返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 非 0 
int setenví(const char *nmame, const char *value, int rewrite); 


int unsetenv(const char *name); 


两 个 函数 返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 





这 3 个 函数 的 操作 如 下 。 

e putenv 取 形 式 为 name=value HFS, 将 其 放 到 环境 表 中 。 如 果 name DARE, WWE 
删除 其 原来 的 定义 。 

e setenv 将 name 设置 为 value。 如 果 在 环境 中 name DARE, WA (a) XE rewrite AE 0, 
则 首先 删除 其 现 有 的 定义 ，(b) 车 rewrite 为 0O， 则 不 删除 其 现 有 定义 (name 不 设置 为 新 
的 value， 而 且 也 不 出 错 )。 

e unsetenv 删除 name 的 定义 。 即 使 不 存在 这 种 定义 也 不 算出 错 。 


注意 ，putenv 和 setenv 之 间 的 差别 。setenv 必须 分 配 存 储 空间 ， 以 便 依据 其 参数 创建 
! name — value F $ , putenv 可 以 自由 地 将 传递 给 它 的 参数 字符 串 直 接 放 到 环境 中 。 确 实 , 许多 
| 实现 就 是 这 么 做 的 ， 因 此 ， 将 存放 在 栈 中 的 字符 串 作 为 参数 传递 给 putenv 就 会 发 生 错误 ， 其 原 
| 因 是 ， 从 当前 邓 数 返回 时 ， 其 栈 帧 占用 的 存储 区 可 能 将 被 重用 。 


这 些 函 数 在 修改 环境 表 时 是 如 何 进行 操作 的 呢 ? 对 这 一 问题 进行 研究 、 考 察 是 非常 有 益 的 。 
回忆 图 7-6， 其 中 ， 环 境 表 〈 指 向 实际 name-value 字符 串 的 指针 数组 》 和 环境 字符 串通 常 存 放 在 
进程 存储 空 | 然 
后 将 所 有 后 续 指针 都 向 环境 表 首 部 顺 次 移动 一 个 位 团 。 但 是 增加 一 个 字符 串 或 修改 一 个 现 有 的 字 
符 串 就 困难 得 多 。 环 境 表 和 环境 字符 串通 常 占 用 的 是 进程 地 址 空间 的 顶部 ， 所 以 它 不 能 再 向 高 地 
址 方向 (向上) 扩展: 同时 也 不 能 移动 在 它 之 下 的 各 栈 帧 ， 所 以 它 也 不 能 向 低地 址 方向 (向 下 》 
扩展 。 两 者 组 合 使 得 该 空间 的 长 度 不 能 再 增加 。 
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(1) 如 果 修 改 一 个 现 有 的 name: 

a. 如果 新 value 的 长 度 少 于 或 等 于 现 有 value 的 长 度 ， 则 只 要 将 新 字符 串 复制 到 原 字符 串 所 
用 的 空间 中 ; 

b. 如 果 新 value 的 长 度 大 于 原 长 度 ， 则 必须 调用 malloc 为 新 字符 串 分 配 空间 ， 然 后 将 新 字 
符 串 复制 到 该 空间 中 ， 接 着 使 环境 表 中 针对 name 的 指针 指向 新 分 配 区 。 

(2) 如 果 要 增加 一 个 新 的 name， 则 操作 就 更 加 复杂 。 首 先 ， 必须 调 用 malloc 为 name-value 


字符 串 分 配 空间 ， 然 后 将 该 字符 串 复制 到 此 空间 中 。 


a. 如果 这 是 第 一 次 增加 一 个 新 name， 则 必须 调用 malloc 为 新 的 指针 表 分 配 空间 。 接 着 ， 
将 原来 的 环境 表 复 制 到 新 分 配 区 ， 并 将 指向 新 name=value 字符 串 的 指针 存放 在 该 指针 表 
的 表 尾 ， 然 后 又 将 一 个 空 指 针 存 放 在 其 后 。 最 后 使 environ 指向 新 指针 表 。 再 看 一 下 图 
7-6， 如 果 原 来 的 环境 表 位 于 栈 顶 之 上 《这 是 一 种 常见 情况 )， 那 么 必须 将 此 表 移 至 堆 中 。 
但 是 ， 此 表 中 的 大 多 数 指针 仍 指向 栈 顶 之 上 的 各 name-value FRP. 

b. 如果 这 不 是 第 一 次 增加 一 个 新 name， 则 可 知 以 前 已 调用 malloc 在 堆 中 为 环境 表 分 配 了 
空间 ， 所 以 只 要 调用 realloc， 以 分 配 比 原 空 间 多 存放 一 个 指针 的 空间 。 然 后 将 指向 新 
name=value 字符 串 的 指针 存放 在 该 表 表 尾 ， 后 面 跟 着 一 个 空 指针 。 


7.10 PAR setjmp 和 longjmp 


在 C 中 , goto 语句 是 不 能 跨越 函数 的 ,而 执行 这 种 类 型 跳 转 功能 的 是 函数 setjmp 和 Longjmp. 


这 两 个 函数 对 于 处 理发 生 在 很 深层 嵌 套 函数 调用 中 的 出 错 情况 是 非常 有 用 的 。 


考虑 图 7-9 程序 的 骨架 部 分 。 其 主 循环 是 从 标准 输入 读 一 行 , 然后 调用 do line 处 理 该 输入 


ÍT. do line 函数 调用 get token 从 该 输入 行 中 取 下 一 个 标记 。 一行 中 的 第 一 个 标记 假定 是 一 
[213] 条 某 种 形式 的 命令 ，switch 语句 就 实现 命令 选择 。 对 程序 中 示例 的 命令 调用 cma, ada BK. 


#include "apue.h" 


#define TOK ADD 5 
void do line(char *); 
void cmd, add (void); 


int 


int 


get token (void); 


main (void) 


{ 


char Line [MAXLINE]; 


while (fgets(line, MAXLINE, stdin) != NULL) 
do_line(line); 
exit (0); 
} 
char *tok_ptr; /* global pointer for get token() */ 


void 
do line(char *ptr) /* process one line of input */ 


{ 
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int cmd; 


tok ptr = ptr; 
while ((cmd = get token()) > 0) ( 
switch (cmd) { /* one case for each command */ 
case TOK_ADD: 
cmd add(); 
break; 


} 


void 
cmd_add (void) 
{ 


int token; 


token = get token(); 
/* rest of processing for this command */ 


} 


int 
get token (void) 
{ 
/* fetch next token from line pointed to by tok_ptr */ 
} 


7-9 ”进行 命令 处 理 程序 的 典型 骨架 部 分 


7-9 的 程序 的 骨架 部 分 在 读 命令 、 确 定 命令 的 类 型 ， 然 后 调用 相应 函数 处 理 每 一 条 命令 这 
类 程序 中 是 非常 典型 的 。 图 7-10 显示 了 调用 了 cmd add 之 后 栈 的 大 致使 用 情况 。 


自动 变量 的 存储 单元 在 每 个 函数 的 栈 桢 中 。 数 组 校 的 底部 


line YE main 的 栈 帧 中 , BAY cmd 在 do_line 的 栈 帧 
rH, 3&7 token 在 cmd add 的 栈 帧 中 。 

如 上 所 述 ， 这 种 形式 的 栈 安排 是 非常 典型 的 ， 但 并 
不 要 求 非 如 此 不 可 。 栈 并 不 一 定 要 向 低地 址 方向 扩充 。 
某 些 系统 对 栈 并 没有 提供 特殊 的 硬件 支持 ， 些 时 一 个 C 
实现 可 能 要 用 链表 实现 栈 帧 。 


是 ， 如 何 处 理 非 致命 性 的 错误 。 例 如 ， 若 cmd ada mm PARN 
数 发 现 一 个 错误 (比如 一 个 无 效 的 数 ), 那么 它 可 能 先 打 


在 编写 图 7-9 这 样 的 程序 时 经 常会 遇 到 的 一 个 问题 | 





高 地 址 


main 


的 栈 帧 


低地 址 


印 一 个 出 错 消息 ， 然 后 忽略 输入 行 的 余下 部 分 ， 返 回 。 图 7-10 调用 ena add 后 的 各 个 栈 由 
main 函数 并 读 下 一 输入 行 。 但 是 如 果 这 种 情况 出 现在 main 函数 中 的 深层 骨 套 层 中 时 ， 用 C 语 
言 难以 做 到 这 一 点 (在 本 例 中 ，cmd_add 函数 只 比 main RATER, 在 有 些 程 序 中 往往 低 5 个 
层次 或 更 多 )。 如 果 我 们 不 得 不 以 检查 返回 值 的 方法 逐 层 返回 ， 那 就 会 变 得 很 麻烦 。 

解决 这 种 问题 的 方法 就 是 使 用 非 局 部 goto 一 一 setjmp 和 longjmp 函数 。 非 局 部 指 的 是 ， 
这 不 是 由 普通 的 C 语言 goto 语句 在 一 个 函数 内 实施 的 跳 转 ， 而 是 在 栈 上 跳 过 若干 调用 帧 ， 返 回 


到 当前 函数 调用 路 径 上 的 某 一 个 函数 中 。 
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finclude <setjmp.h> 


int setjmp(jmp buf env); 


RE: 考 直 接 调用 ， 返 回 0; HM longjmp 返回 ， 则 为 非 0 


void longjmp(jmp buf env, int val); 


在 希望 返回 到 的 位 置 调用 setjmp， 在 本 例 中 ， 此 位 置 在 main 函数 中 。 因 为 我 们 直接 调用 
该 函数 ， 所 以 其 返回 值 为 0。setjmp 参数 env 的 类 型 是 一 个 特殊 类 型 jmp_buf。 这 一 数据 类 型 
是 某 种 形式 的 数组 ， 其 中 存放 在 调用 longjmp 时 能 用 来 恢复 栈 状态 的 所 有 信息 。 因 为 需 在 另 一 
个 函数 中 引用 env 变量 ， 所 以 通常 将 env 变量 定义 为 全 局 变量 。 

当 检 查 到 一 个 错误 时 ， 例 如 在 cmd add 函数 中 ， 则 以 两 个 参数 调用 longjmp 函数 。 第 一 个 就 是 
在 调用 setjmp 时 所 用 的 env; 第 二 个 参数 是 具 非 0 值 的 val， 它 将 成 为 从 set mp 处 返回 的 值 。 使 用 
第 二 个 参数 的 原因 是 对 于 一 个 setjmp 可 以 有 多 个 longjmp。 例如 , 可 以 在 cmd, add PUL val 为 1 8 
用 longjmp， 也 可 在 get token "PU val 为 2 调用 longjmp。 在 main 函数 中 ，setjmp 的 返回 值 
就 会 是 1 或 2， 通 过 测试 返回 值 就 可 判断 造成 返回 的 Longjmp 是 在 cmd, add 还 是 在 get. token F. 

再 回 到 程序 实例 中 ， 图 7-11 中 给 出 了 经 修改 过 后 的 main 和 cmd. add 函数 〈 其 他 两 个 函数 
do line Ñ get token 未 更 改 )。 





#include "apue.h" 
#include <setjmp.h> 


#define TOK_ADD 5 
jmp buf  jmpbuffer; 
int 

main(void) 


{ 
char line [MAXLINE] ; 


if (setjmp(jmpbuffer) != 0) 
printf ("error"); 

while (fgets(line, MAXLINE, stdin) !- NULL) 
do_line (line); 

exit (0); 


void 
cmd, add (void) 
í 

int token; 


token = get token(); 

if (token < 0) /* an error has occurred */ 
longjmp(jmpbuffer, 1); 

/* rest of processing for this command */ 





7-11 setjmp 和 longjmp 实例 
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执行 main Hj, 调用 setjmp， 它 将 所 需 的 信息 记 入 变量 jmpbuffer 中 并 返回 0。 然后 调用 
do line, 它 又 调用 cmd, add. 假定 在 其 中 检测 到 一 mum 高 地 址 
BR. 在 cmd add 中 调用 Longjmp 之 前 ， 栈 如 
7-10 中 所 示 。 但 是 1ongjmp 使 栈 反 绕 到 执行 main main 的 栈 巾 
函数 时 的 情况 ， 也 就 是 抛弃 了 cmd_add Wido line 
的 栈 帧 〈 见 图 7-12)。 调 用 longjmp 造成 main 中 
setjmp MRE, HE, iX — X Bx [S ff 1 
(longjmp 的 第 二 个 参数 )。 

1， 自 动 变量 、 寄 存 器 变量 和 易 失 变量 armen 

我 们 已 经 了 解 在 调用 longjmp 后 栈 帧 的 基本 结 低地 址 
构 ， 下 一 个 问题 是 :“ 在 main 函数 中 ， 自 动 变量 和 寄 7-12 在 调用 longjmp 后 的 栈 帧 
存 器 变量 的 状态 如 何 ? ” 当 longjmp 返回 到 main 函数 时 ， 这 些 变 量 的 值 是 否 能 恢复 到 以 前 调 
用 setjmp 时 的 值 ( 即 回 深 到 原先 值 ), 或 者 这 些 变量 的 值 保 持 为 调用 do. line 时 的 值 (do_line 
调用 cmd add. cmd add 又 调用 longjmp) ? 遗憾 的 是 ， 对 此 问题 的 回答 是 “看 情况 ”。 大 多 
数 实现 并 不 回 滚 这 些 自动 变量 和 寄存 器 变量 的 值 ， 而 所 有 标准 则 称 它 们 的 值 是 不 确定 的 。 如 果 你 
有 一 个 自动 变量 ， 而 又 不 想 使 其 值 回 滚 ， 则 可 定义 其 为 具有 volatile 属性 。 声 明 为 全 局 变量 或 
静态 变量 的 值 在 执行 longjmp 时 保持 不 变 。 


^w 实 例 
下 面 我 们 通过 图 7-13 程序 说 明 在 调用 longjmp 后 ， 自 动 变量 、 全 局 变量 、 寄 存 器 变量 、 静 
态 变 量 和 易 失 变量 的 不 同情 况 。 217 


#include "apue.h" 
#include «setjmp.h» 


Static void fl(int, int, int, int); 
static void  f2(void); 


static jmp buf jmpbuffer; 
static int globval: 


int 

main(void) 

{ 
int autoval; 
register int regival; 
volatile int volaval; 
static int statval; 


globval = 1; autoval = 2; regival = 3; volaval = 4; statval = 5; 


if (setjmp(jmpbuffer) != 0) { 
printf ("after longjmp:\n"); 
printf ("globval = %d, autoval = $d, regival = $d," 
" volaval = td, statval = %d\n", 
globval, autoval, regival, volaval, statval); 
exit (0); 
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) 


/* 

* Change variables after setjmp, but before longjmp. 
xy 

globval = 95; autoval = 96; regival = 97; volaval = 98; 
statval - 99; 


fl(autoval, regival, volaval, statval);/* never returns */ 
exit (0); 
} 


static void 
fl(int i, int j, int k, int 1l) 
i 
printf("in f1():WMn"); 
printf("globval = %d, autoval = $d, regival = $d," 
" volaval = $d, statval = td\n", globval, i, j, k, 1); 
£2(): 
) 


static void 
£2 (void) 
{ 
longjmp(jmpbuffer, 1); 
} 


图 7-13 longjmp 对 各 类 变量 的 影响 
如 果 以 不 带 优 化 和 带 优化 选项 对 此 程序 分 别 进 行 编译 ， 然 后 运行 它们 ， 则 得 到 的 结果 是 不 同 的 ; 
$ gcc testjmp.c 不 进行 任何 优化 的 编译 
$ ./a.out 
in f1(): 


globval = 95, autoval = 96, regival = 97, volaval = 98, statval = 99 
after longjmp: 

globval = 95, autoval = 96, regival = 97, volaval = 98, statval - 99 
$ gee -O testjmp.c 进行 全 部 优化 的 编译 

$ ./a.out 

in f1(): 

globval = 95, autoval = 96, regival = 97, volaval = 98, statval = 99 
after longjmp: 

globval = 95, autoval = 2, regival = 3, volaval = 98, statval = 99 


注意 ， 全 局 变量 、 静 态 变量 和 易 失 变量 不 受 优化 的 影响 ， 在 longjmp 之 后 ， 它 们 的 值 是 最 近 所 
BU. TEXT BU setjmp(3) 手 册页 上 说 明 ， 存 放 在 存储 器 中 的 变量 将 具有 longjmp 时 
的 值 ， 而 在 CPU 和 浮 点 寄存 器 中 的 变量 则 恢复 为 调用 setjmp 时 的 值 。 这 确实 就 是 运行 图 7-13 程 
序 时 所 观察 到 的 值 。 不 进行 优化 时 ， 所 有 这 5 个 变量 都 存放 在 存储 器 中 《〈 即 忽略 了 对 regival 变量 
的 register 存储 类 说 明 )。 而 进行 了 优化 后 ，autoval 和 regival 都 存放 在 寄存 器 中 (即使 
autoval 并 未 说 明 为 register), volatile 变量 则 仍 存放 在 存储 器 中 。 通 过 这 一 实例 我 们 可 
以 理解 到 ， 如 果 要 编写 一 个 使 用 非 局 部 跳 转 的 可 移植 程序 ， 则 必须 使 用 volatile 属性 。 但 是 从 
一 个 系统 移植 到 另 一 个 系统 ， 其 他 任何 事情 都 可 能 改变 。 

在 图 7-13 rh, 某 些 printf 的 格式 字符 串 可 能 不 适宜 安排 在 程序 文本 的 一 行 中 。 我 们 没有 将 
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其 分 成 多 个 printf 调用 ， 而 是 使 用 了 ISOC 的 字符 串 连接 功能 ， 于 是 两 个 字符 串 序列 
"stringl" "string2" 

等 价 于 
"stringlstring2" a” 


第 10 章 讨论 信号 处 理 程序 及 sigsetjmp 和 siglongjmp 时 ， 将 再 次 涉及 setjmp 和 longjmp 
函数 ， 

2， 自 动 变量 的 潜在 问题 

前 面 已 经 说 明了 处 理 栈 帧 的 一 般 方 式 ， 现 在 值得 分 析 一 下 自动 变量 的 一 个 潜在 出 错 情况 。 基 
本 规则 是 声明 自动 变量 的 函数 已 经 返回 后 ， 不 能 再 引用 这 些 自动 变量 。 在 整个 UNIX 手册 中 ， 关 
于 这 一 点 有 很 多 警告 。 

7-14 中 给 出 了 一 个 名 为 open_data 的 函数 ， 它 打开 了 一 个 标准 IO 流 ， 然 后 为 该 流 设置 缓冲 。 


#include <stdio.h> 


FILE * 
open_data (void) 
{ 
FILE *fp; 
Char databuf[BUFSI2Z]; /* setvbuf makes this the stdio buffer */ 


if ((fp = fopen("datafile", "r")) -- NULL) 
return(NULL); 

if (setvbuf(fp, databuf,  IOLBF, BUFSIZ) != 0) 
return(NULL); 

return(fp); /* error */ 


7-14 ”自动 变量 的 不 正确 使 用 
问题 是 : 当 open data 返回 时 ， 它 在 栈 上 所 使 用 的 空间 将 由 下 一 个 被 调用 函数 的 栈 帧 使 用 。 
但 是 ， 标 准 VO 库 函 数 仍 将 使 用 这 部 分 存储 空间 作为 该 流 的 缓冲 区 。 这 就 产生 了 冲突 和 混乱 。 为 
了 改正 这 一 问题 ， 应 在 全 局 存储 空间 静态 地 (如 static BK extern) 或 者 动态 地 (使 用 一 种 alloc 
函数 ) 为 数组 databuf 分 配 空间 。 
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每 个 进程 都 有 一 组 资源 限制 , 其 中 一 些 可 以 用 getrlimit 和 setrlimit 函数 查询 和 更 改 。 


#include <sys/resource.h> 


int getrlimit(int resource, struct rlimit *riptr) ; 


int setrlimit(int resource, const struct rlimit *rlptr); 


两 个 函数 返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 非 0 





| 这 两 个 函数 在 Single UNIX Specification 的 XSI 扩展 中 定义 。 进 程 的 资源 限制 通常 是 在 系统 初始 
.化 时 由 0 进程 建立 的 ， 然 后 由 后 续 进程 继承 。 每 种 实现 都 可 以 用 自己 的 方法 对 资源 限制 做 出 调整 。 


对 这 两 个 函数 的 每 一 次 调用 都 指定 一 个 资源 以 及 一 个 指向 下 列 结构 的 指针 。 
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struct rlimit 1 
rlim t rlim, cur; 
rlim t rlim max; 


); 


/* soft limit: current limit */ 
/* hard limit: maximum value for rlim cur */ 


在 更 改 资源 限制 时 ， 须 遵循 下 列 3 条 规则 。 
C1) 任何 一 个 进程 都 可 将 一 个 软 限 制 值 更 改 为 小 于 或 等 于 其 硬 限 制 值 。 
(2) 任何 一 个 进程 都 可 降低 其 硬 限制 值 ， 但 它 必须 大 于 或 等 于 其 软 限制 值 。 这 种 降低 ， 对 普 


通用 户 而 言 是 不 可 逆 的 。 


(3) 只 有 超级 用 户 进程 可 以 提高 硬 限 制 值 。 

常量 RLIM_INFINITY 指定 了 一 个 无 限量 的 限制 。 

这 两 个 函数 的 resource 参数 取 下 列 值 之 一 ,图 7-15 显示 哪些 资源 限制 是 由 Single UNIX 
Specification 定义 并 由 本 书 讨论 的 4 种 UNIX 系统 实现 支持 的 。 


|  mH8 fxs FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 


RLIMIT AS 
RLIMIT. CORE 
RLIMIT CPU 
RLIMIT DATA 
RLIMIT. FSIZE 
RLIMIT MEMLOCK 
RLIMIT MSGQUEUE 
RLIMIT NICE 
RLIMIT_NOFILE 
RLIMIT_NPROC 
RLIMIT_NPTS 
RLIMIT_RSS 
RLIMIT_SBSIZE 
RLIMIT_SIGPENDING 
RLIMIT STACK 
RLIMIT SWAP 
RLIMIT VMEM 


RLIMIT AS 


RLIMIT CORE 
RLIMIT CPU 


RLIMIT DATA 


RLIMIT FSIZE 


RLIMIT MEMLOCK 


RLIMIT MSGQUEUE 
RLIMIT NICE 





图 7-15 对 资源 限制 的 支持 


进程 总 的 可 用 存储 空间 的 最 大 长 度 〈 字 节 )。 这 影响 到 sork 函数 
(1.11 4$) 和 mmap 函数 (14.8 节 )。 

core 文件 的 最 大 字 节 数 ， 若 其 值 为 0 则 阻止 创建 core 文件 。 

CPU 时 间 的 最 大 量 值 ( 秒 ), 当 超 过 此 软 限制 时 , 向 该 进程 发 送 SIGXCPU 
信号。 

数据 段 的 最 大 字 节 长 度 。 这 是 图 7-6 中 初始 化 数据 、 非 初始 以 及 堆 
的 总 和 。 

可 以 创建 的 文件 的 最 大 字 节 长 度 。 当 超过 此 软 限制 时 ， 则 向 该 进程 
发 送 SIGXFSZ 信号 。 

一 个 进程 使 用 mlock(2) 能 够 锁定 在 存储 空间 中 的 最 大 字 节 长 度 。 
进程 为 POSIX 消息 队列 可 分 配 的 最 大 存储 字 节 数 。 

为 了 影响 进程 的 调度 优先 级 ，nice f (8.16 节 ) 可 设置 的 最 大 限制 。 


7.11 函数 getrlimit 和 setrlimit 177 


RLIMIT NOFILE 每 个 进程 能 打开 的 最 多 文件 数 。 更 改 此 限制 将 影响 到 sysconf 函数 
在 参数 _SC_OPEN_MAX 中 返回 的 值 ( 见 2.5.4 节 )， 亦 见 图 2-17. 

RLIMIT NPROC & Sc bx FH P^ ID 可 拥有 的 最 大 子 进 程 数 。 更 改 此 限制 将 影响 到 
sysconf 函数 在 参数 sc cHILD MAX 中 返回 的 值 ( 见 2.5.4 节 )。 

RLIMIT_NPTS 用 户 可 同时 打开 的 伪 终 端 (第 19 章 ) 的 最 大 数量 。 

RLIMIT_RSS BAH AGES TEE (resident set size in bytes，RSS)。 如 果 可 用 
的 物理 存储 器 非常 少 ， 则 内 核 将 从 进程 处 取 回 超过 RSS 的 部 分 。 

RLIMIT SBSIZE 在 任 一 给 定时 刻 ， 一 个 用 户 可 以 占用 的 套 接 字 缓 冲 区 的 最 大 长 度 


(#47). 

RLIMIT SIGPENDING 一 个 进程 可 排队 的 信号 最 大 数量 。 这 个 限制 是 sigqueue 函数 实施 
的 《10.20 节 )。 

RLIMIT_STACK 栈 的 最 大 字 节 长 度 。 见 图 7-6。 

RLIMIT_SWAP 用 户 可 消耗 的 交换 空间 的 最 大 字 节 数 

RLIMIT_VMEM 这 是 RLIMIT AS 的 同义词 。 


资源 限制 影响 到 调用 进程 并 由 其 子 进程 继承 。 这 就 意味 着 ， 为 了 影响 一 个 用 户 的 所 有 后 续 进 
程 ， 需 将 资源 限制 的 设置 构造 在 shel 之 中 。 确 实 ，Bourme shell, GNU Bourne-again shell 和 Kom 
shell RA ABAD ulimit 命令 ，C shell 具有 内 置 limit 命令 。(umask 和 chdir 函数 也 必须 是 
shell Ai EKI. ) 
A 

7-16 的 程序 打印 由 系统 支持 的 所 有 资源 当前 的 软 限 制 和 硬 限 制 . 为 了 在 各 种 实现 上 编译 该 [221 
程序 ,我 们 已 经 条 件 地 包括 了 各 种 不 同 的 资源 名 。 注 意 , 有 些 平台 定义 zlim 上 七 为 unsigned long 
long 而 非 unsigned Long。 在 同一 系统 中 这 个 定义 可 能 也 会 变动 ， 这 取决 于 我 们 在 编译 程序 
候 是 否 支持 64 位 文件 。 有 些 限制 作用 于 文件 大 小 ， 因 此 rlim t 类 型 必须 足够 大 才能 表示 文件 
大 小 限制 。 为 了 避免 使 用 错误 的 格式 说 明 而 导致 编译 器 警告 ， 通 常会 首先 把 限制 复制 到 64 位 整 
型 ， 这 样 只 需 处 理 一 种 格式 。 


#include "apue.h" 
#include <sys/resource.h> 


#define doit (name) pr_limits(#name, name) 
static void pr limits(char *, int); 


int 

main (void) 

{ 

#ifdef RLIMIT_AS 
doit (RLIMIT_AS) ; 

#endif 


doit (RLIMIT_CORE) ; 
doit (RLIMIT CPU); 

doit (RLIMIT_DATA) ; 
doit(RLIMIT FSIZE); 
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#ifdef RLIMIT_MEMLOCK 
doit (RLIMIT_MEMLOCK) ; 
kendif 


#ifdef RLIMIT MSGQUEUE 
doit(RLIMIT MSGQUEUE); 
#endif 


#ifdef RLIMIT_NICE 
doit(RLIMIT NICE); 
fendif 


doit (RLIMIT_NOFILE) ; 


#ifdef RLIMIT NPROC 
doit(RLIMIT NPROC); 
#endif 


#ifdef RLIMIT NPTS 
doit (RLIMIT_NPTS) ; 
#endif 


#ifdeft RLIMIT_RSS 
doit (RLIMIT_RSS) ; 
#endif 


#ifdef RLIMIT_SBSIZE 
doit (RLIMIT_SBSIZE); 
dendif 


#ifdef RLIMIT SIGPENDING 


doit (RLIMIT_SIGPENDING) ; 


#endif 
doit (RLIMIT_ STACK); 
#ifdef RLIMIT_SWAP 
doit (RLIMIT_SWAP) ; 
#endif 
#ifdef RLIMIT_VMEM 
doit (RLIMIT_VMEM} ; 
#endif 


exit (0); 


Static void 





pr_limits(char *name, int resource) 


{ 


struct rlimit limit; 


unsigned long long lim; 


if (getrlimit(resource, 


&limit) < 0) 


err sys("getrlimit error for $s", name); 


printfí("$-14s 


", name); 


if (limit.rlim cur == RLIM INFINITY) { 


printf("(infinite) 


) else { 


")3 


lim = limit.rlim, cur; 


printf("*1011d ", 


) 


lim); 


if (limit.rlim max == RLIM INFINITY) { 
printf ("(infinite)"); 


} else { 


lim = limit. rlim_max; 
printfí("*1011d", lim); 


} 


putchar((int)'\n"'); 


例如 ， 
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图 7-16 打印 当前 资源 限制 
注意 , 在 doit 宏 中 使 用 了 ISOC 的 字符 串 创建 算 符 〈# )， 以 便 为 每 个 资源 名 产生 字符 串 值 。 


doit (RLIMIT CORE); 


$ ./a.out 
RLIMIT. AS 
RLIMIT CORE 
RLIMIT CPU 
RLIMIT DATA 
RLIMIT FSIZE 
RLIMIT MEMLOCRK 
RLIMIT NOFILE 
RLIMIT NPROC 
RLIMIT NPTS 
RLIMIT RSS 
RLIMIT SBSIZE 
RLIMIT STACK 
RLIMIT SWAP 
RLIMIT VMEM 


这 将 由 C 预 处 理 程 序 扩展 为 : 


pr limits ("RLIMIT CORE", 


(infinite) 
(infinite) 
(infinite) 
536870912 
(infinite) 
(infinite) 
3520 


1760 


(infinite) 
(infinite) 
(infinite) 

67108864 
(infinite) 
(infinite) 


在 Solaris 下 运行 此 程序 ， 得 到 ， 


$ ./a.out 
RLIMIT AS 
RLIMIT CORE 
RLIMIT CPU 
RLIMIT DATA 
RLIMIT FSIZE 
RLIMIT NOFILE 
RLIMIT STACK 
RLIMIT VMEM 


(infinite) 
(infinite) 
(infinite) 
(infinite) 
(infinite) 
256 
8388608 
(infinite) 


RLIMIT, CORE); 


在 FreeBSD 下 运行 此 程序 ， 得 到 : 


(infinite) 
(infinite) 
(infinite) 
536870912 
(infinite) 
(infinite) 
3520 
1760 
(infinite) 
(infinite) 
(infinite) 
67108864 
(infinite) 
(infinite) 


(infinite) 
(infinite) 
(infinite) 
(infinite) 
(infinite) 
65536 
(infinite) 
{infinite} 
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在 介绍 了 信号 机 制 后 ， 习 题 10.11 将 继续 讨论 资源 限制 。 
7.12 小 结 


理解 UNIX 系统 环境 中 C 程序 的 环境 是 理解 UNIX 系统 进程 控制 特性 的 先决 条 件 。 本章 说 明 
了 一 个 进程 是 如 何 启动 和 终止 的 ， 如 何 向 其 传递 参数 表 和 环境 。 虽 然 参 数 表 和 环境 都 不 是 由 内 核 
进行 解释 的 ， 但 内 核 起 到 了 从 exec 的 调用 者 将 这 两 者 传递 给 新 进程 的 作用 。 

本 章 也 说 明了 C 程序 的 典型 存储 空间 布局 ， 以 及 一 个 进程 如 何 动态 地 分 配 和 释放 存储 空间 。 
详细 地 了 解 用 于 维护 环境 的 一 些 函 数 是 有 意义 的 ， 因 为 它们 涉及 存储 空间 分 配 。 本 章 也 介绍 了 
setjmp 和 longjmp 函数 ， 它 们 提供 了 一 种 在 进程 内 非 局 部 转移 的 方法 。 最 后 介绍 了 各 种 实现 


提供 的 资源 限制 功能 。 
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Ie 


7.1 € Intel x86 系统 上 ， 使 用 Linux， 如 果 执 行 一 个 输出 “hello, world” 的 程序 但 不 调用 exit 
或 return， 则 程序 的 返回 代码 为 13 (H shell 检查 )， 解 释 其 原因 。 
7.2 7-3 中 的 printf 函数 的 结果 何 时 才 被 真正 输出 ? 
7.3 ”是否 有 方法 不 使 用 (2) 参数 传递 、(b) 全 局 变量 这 两 种 方法 ， 将 main 中 的 参数 arge 和 
argv 传递 给 它 所 调用 的 其 他 函数 ? 
7.4 EEE UNIX 系统 实现 中 执行 程序 时 访问 不 到 其 数据 段 的 0 单元 ， 这 是 一 种 有 意 的 安排 ， 
为 什么 ? 
715 用 C 语言 的 typedef 为 终止 处 理 程 序 定 义 了 一 个 新 的 数据 类 型 EBxitfunc, 使 用 该 类 型 修 
改 atexit 的 原型 。 
7.6 ”如果 用 calloc 分 配 一 个 long 型 的 数组 , 数组 的 初始 值 是 否 为 0? 如 果 用 calloc 分 配 一 
个 指针 数组 ， 数 组 的 初始 值 是 否 为 空 指针 ? 
7.7 在 7.6 节 结尾 处 size 命令 的 输出 结果 中 ， 为 什么 没有 给 过 堆 和 栈 的 大 小 ? 
7.8 ”为 什么 7.7 节 中 两 个 文件 的 大 小 〈879 443 和 8 378) 不 等 于 它们 各 自 文 本 和 数据 大 小 的 和 ? 
7.9 “为 什么 7.7 节 中 对 于 一 个 简单 的 程序 ， 使 用 共享 库 以 后 其 可 执行 文件 的 大 小 变化 如 此 巨大 ? 
710 在 7.10 节 中 我 们 已 经 说 明 为 什么 不 能 将 一 个 指针 返回 给 一 个 自动 变量 ， 下 面 的 程序 是 否 正 确 ? 
int 
fl(int val) 
{ 
int num = 0; 
int *ptr = &num; 
if (val == 0) { 
int val; 
val = 5; 
ptr = &val; 
} 


return(*ptr + 1); 


进程 控制 





8.1 引言 


本 章 介 绍 UNIX 系统 的 进程 控制 ， 包 括 创 建新 进程 、 执 行程 序 和 进程 终止 。 还 将 说 明 进程 属 
性 的 各 种 ID 一 一 实际 、 有 效 和 保存 的 用 户 ID 和 组 ID， 以 及 它们 如 何 受 到 进程 控制 原 语 的 影响 。 
本 章 还 包括 了 解释 器 文件 和 system 函数 。 本 章 最 后 讲述 大 多 数 UNIX 系统 所 提供 的 进程 会 计 机 
制 ， 这 种 机 制 使 我 们 能 够 从 另 一 个 角度 了 解 进程 的 控制 功能 。 


8.2 ”进程 标识 


每 个 进程 都 有 一 个 非 负 整 型 表示 的 唯一 进程 ID. AAH ID 标识 符 总 是 唯一 的 ， 常 将 其 用 
作 其 他 标识 符 的 一 部 分 以 保证 其 唯一 性 。 例 如 ， 应 用 程序 有 时 就 把 进程 ID 作为 名 字 的 一 部 分 来 
创建 一 个 唯一 的 文件 名 。 
虽然 是 唯一 的 ， 但 是 进程 ID 是 可 复 用 的 。 当 一 个 进程 终止 后 ， 其 进程 ID 就 成 为 复 用 的 候选 
者 。 大 多 数 UNIX 系统 实现 延迟 复 用 算法 ， 使 得 赋予 新 建 进程 的 ID 不 同 于 最 近 终止 进程 所 使 用 
的 ID。 这 防止 了 将 新 进程 误 认为 是 使 用 同一 ID 的 某 个 已 终止 的 先前 进程 。 
系统 中 有 一 些 专用 进程 ， 但 具体 细节 随 实现 而 不 同 。ID 为 0 的 进程 通常 是 调度 进程 ， 常 
常 被 称 为 交换 进程 (swapper)。 该 进程 是 内 核 的 一 部 分 ， 它 并 不 执行 任何 磁盘 上 的 程序 ， 因 此 
也 被 称 为 系统 进程 。 进 程 ID 1 通常 是 init 进程 ， 在 自 举 过 程 结 束 时 由 内 核 调 用 。 该 进程 的 
程序 文件 在 UNIX 的 早期 版 本 中 是 /etc/init， 在 较 新 版 本 中 是 /sbin/init。 此 进程 负责 
在 自 举 内 核 后 启动 一 个 UNIX KK. init 通常 读 取 与 系统 有 关 的 初始 化 文件 C/etc/rc* X 
件 或 /etc/inittab 文件 ， 以 及 在 /etc/init .a 中 的 文件 )， 并 将 系统 引导 到 一 个 状态 (如 
ZHP) init 进程 决 不 会 终止 。 它 是 一 个 普通 的 用 户 进 程 (与 交换 进程 不 同 ， 它 不 是 内 核 
中 的 系统 进程 )， 但 是 它 以 超级 用 户 特 权 运 行 。 本 章 稍 后 部 分 会 说 明 init 如 何 成 为 所 有 孤儿 
进程 的 父 进程 。 
| 在 Mac OS X 10.4 P, init 进程 被 launchd 进程 替代 ， 执 行 的 任务 集 与 init 相同 ,但 扩 
| 展 了 功能 。 可 参阅 Singh[2006] 在 5.10 节 中 的 讨论 来 了 解 launchd 是 如 何 操作 的 。 


每 个 UNIX 系统 实现 都 有 它 自己 的 一 套 提供 操作 系统 服务 的 内 核 进程 ， 例 如 ， 在 某 些 UNIX 
的 虚拟 存储 器 实现 中 ， 进 程 ID 2 是 页 守护 进程 (page daemon)， 此 进程 负责 支持 虚拟 存储 器 系统 
的 分 页 操作 。 
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除了 进程 DD， 每 个 进程 还 有 一 些 其 他 标识 符 。 下 列 函 数 返 回 这 些 标识 符 。 


#include <unistd.h> 
pid t getpid(void); 


返回 值 ， 调用 进程 的 进程 ID 
pid t getppid(void); 


返回 值 ， 调 用 进程 的 父 进 程 ID 


uid t getuid(void); 

返回 值 ， 调 用 进程 的 实际 用 户 ID 
uid t geteuid(void); 

返回 值 ， 调 用 进程 的 有 效用 户 ID 
gid t getgid(void); 


返回 值 ， 调 用 进程 的 实际 组 ID 
gid t getegid(void): 
返回 值 ， 调 用 进程 的 有 效 组 ID 





注意 ， 这 些 函 数 都 没有 出 错 返 回 ， 在 下 一 节 讨 论 fork 函数 时 ， 将 进一步 讨论 父 进程 ID。 在 
44 节 中 已 讨论 了 实际 和 有 效用 户 ID 及 组 ID. 


8.3 EH fork 


一 个 现 有 的 进程 可 以 调用 fork 函数 创建 一 个 新 进程 。 


#include <unistd.h> 


pid t fork(void); 


返回 值 ， 子 进程 返回 0， 父 进程 返回 子 进程 DD， 若 出 错 ， 返 回 -1 





由 fork 创建 的 新 进程 被 称 为 子 进程 (child process). fork 函数 被 调用 一 次 ， 但 返回 两 
次 。 两 次 返回 的 区 别 是 子 进程 的 返回 值 是 0， 而 父 进 程 的 返回 值 则 是 新 建 子 进程 的 进程 ID。 
将 子 进程 ID 返回 给 父 进程 的 理由 是 : 因为 一 个 进程 的 子 进程 可 以 有 多 个 ， 并 且 没 有 一 个 函数 
使 一 个 进程 可 以 获得 其 所 有 子 进程 的 进程 ID. fork 使 子 进 程 得 到 返回 值 0 的 理由 是 : 一 个 
进程 只 会 有 一 个 父 进程 ， 所 以 子 进程 总 是 可 以 调用 getppid 以 获得 其 父 进程 的 进程 ID (XE 
程 ID 0 总 是 由 内 核 交换 进程 使 用 ， 所 以 一 个 子 进程 的 进程 ID 不 可 能 为 0)。 

子 进程 和 父 进程 继续 执行 fork 调用 之 后 的 指令 。 子 进程 是 父 进程 的 副本 。 例 如 ， 子 进程 获 
得 父 进程 数据 空间 、 堆 和 栈 的 副本 。 注 意 ， 这 是 子 进 程 所 拥有 的 副本 。 父 进程 和 子 进程 并 不 共享 
这 些 存储 空间 部 分 。 父 进程 和 子 进 程 共享 正文 段 ( 见 7.6 节 )。 

由 于 在 fork 之 后 经 常 跟随 着 exec, 所 以 现在 的 很 多 实现 并 不 执行 一 个 父 进 程 数 据 段 、 
栈 和 堆 的 完全 副本 。 作 为 替代 ， 使 用 了 写 时 复制 (Copy-On-Write; COW) 技术。 这 些 区 域 
由 父 进程 和 子 进程 共享 ， 而 且 内 核 将 它们 的 访问 权限 改变 为 只 读 。 如 果 父 进程 和 子 进 程 中 的 
任 一 个 试图 修改 这 些 区 域 , 则 内 核 只 为 修改 区 域 的 那 块 内 存 制 作 一 个 副本 , 通常 是 虚拟 存储 
系统 中 的 一 “页 ”。Bach[1986] 的 9.2 节 和 McKusick 等 [1996] 的 5.6 节 和 5.7 节 对 这 种 特征 
做 了 更 详细 的 说 明 。 
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某 些 平台 提供 fork 函数 的 几 种 变 体 。 本 书 讨论 的 4 种 平台 都 支持 下 节 将 要 讨论 的 vfork(2)。 
Linux 3.2.0 #47 3 — fé st 44] it i d — —cloneQ)f B8, 3x € — fr fork 的 推广 
形式， 它 克 许 调用 者 控制 哪些 部 分 由 父 进程 和 子 进 程 共 享 。 
| FreeBSD 8.0 提供 了 rfork(2) 系 统 调用 , "C XA T. Linux 的 clone RAMA. rfork 调用 是 
| 从 Plan 9 操作 系统 ( Pike 等 [1995] ) 派生 出 来 的 。 

Solaris 10 提供 了 两 个 线程 库 : 一 个 用 于 POSIX 线程 ( pthreads )， 另 一 个 用 于 Solaris 线程 。 
| 在 这 两 个 线程 库 中 ，fork 的 行为 有 所 不 同 。 对 于 POSIX 线程 ，fork 创建 一 个 进程 ， 它 仅 包含 
: 调用 该 fork 的 线程 ， 但 对 于 Solaris RH, fork 创建 的 进程 包含 了 调用 线程 所 在 进程 的 所 有 线 
” 程 的 副本 。 在 Solaris 10 中 ， 这 种 行为 改变 了 。 不 管 使 用 哪 种 线程 库 ，fork 创建 的 于 进程 只 保留 
| 调用 线程 的 副本 。Solaris 也 提供 了 fork] 函数 ， 它 创建 的 进程 只 复制 调用 线程 。 还 有 forkall 
| 函数 ， 它 创建 的 进程 复制 了 进程 中 所 有 的 线程 。 第 11 章 和 第 12 章 将 详细 讨论 线程 。 


LES 
图 8-1 程序 演示 了 fork 函数 ， 从 中 可 以 看 到 子 进程 对 变量 所 做 的 改变 并 不 影响 父 进 程 中 该 
变量 的 值 。 


#include "apue.h" 


int globvar - 6; /* external variable in initialized data */ 
charbuf[] = "a write to stdout\n"; 
int 


main(void) 

{ 
int var; /* automatic variable on the stack */ 
pid t pid; 


var - 88; 

if (write(STDOUT FILENO, buf, sizeof(buf)-1) != sizeof(buf)-1) 
err sys("write error"); 

printf("before forkWMn");  /* we don't flush stdout */ 


if ((pid = fork) < 0) { 
err sys("fork error"); 


} else if (pid == 0) ( /* child */ 
globvartt; /* modify variables */ 
vartt; 

) else | 
sleep(2); /* parent */ 


} 


printf("pid = %ld, glob = %d, var = %d\n", (long)getpid(), globvar, 
var); 
exit (0); 


8-1 fork 函数 实例 
如 果 执 行 此 程序 则 得 到 ; 
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$ ./a.out 

a write to stdout 

before fork 

pid = 430, glob = 7, var = 89  ” 子 进 程 的 变量 值 改 变 了 
pid = 429, glob = 6, var = 88 父 进程 的 变量 值 没有 改变 
$ a.out > temp.out 

$ cat temp.out 

a write to stdout 

before fork 

pid = 432, glob = 7, var - 89 

before fork 

pid - 431, glob - 6, var - 88 


一 般 来 说 ， 在 fork 之 后 是 父 进程 先 执 行 还 是 子 进程 先 执行 是 不 确定 的 ， 这 取决 于 内 核 所 使 
用 的 调度 算法 。 如 果 要 求 父 进程 和 子 进 程 之 间 相 互 同步 ， 则 要 求 某 种 形式 的 进程 间 通 信 。 在 图 8-1 
程序 中 ， 父 进程 使 自己 休眠 2 s， 以 此 使 子 进程 先 执行 。 但 并 不 保证 2 s 已 经 足够 ， 在 8.9 节 讲 述 
竟 争 条 件 时 还 将 谈 及 这 一 问题 及 其 他 类 型 的 同步 方法 。 在 10.16 节 中 ， 我 们 将 说 明 在 fork 之 后 
如 何 使 用 信和 号 使 父 进程 和 子 进程 同步 。 
当 写 标准 输出 时 ， 我 们 将 buf KERE 1 作为 输出 字 节 数 ， 这 是 为 了 避免 将 终止 null 字 
节 写 出 。strlen 计算 不 包含 终止 null 字 节 的 字符 串 长 度 ， 而 sizeof 则 计算 包括 终止 null 
字 节 的 缓冲 区 长 度 。 两 者 之 间 的 另 一 个 差别 是 ， 使 用 strlen 需 进行 一 次 函数 调用 ， 而 对 于 
sizeof 而 言 ， 因 为 缓冲 区 己 用 已 知 字 符 串 进行 初始 化 ， 其 长 度 是 固定 的 ， 所 以 sizeof 是 
在 编译 时 计算 缓冲 区 长 度 。 
注意 图 8-1 所 示 的 程序 中 fork 与 LO 函数 之 间 的 交互 关系 。 回 忆 第 3 章 中 所 述 ，write PH 
数 是 不 带 缓冲 的 。 因 为 在 fork 之 前 调用 write， 所 以 其 数据 写 到 标准 输出 一 次 。 但 是 , 标准 VO 
库 是 带 缓冲 的 。 回 忆 一 下 5.12 节 ， 如 果 标 准 输出 连 到 终端 设备 ， 则 它 是 行 缓冲 的 ; 否则 它 是 全 组 
冲 的 。 当 以 交互 方式 运行 该 程序 时 ， 只 得 到 该 printf 输出 的 行 一 次 ， 其 原因 是 标准 输出 缓冲 区 
由 换行 符 冲洗 。 但 是 当 将 标准 输出 重 定向 到 一 个 文件 时 , 却 得 到 printf 输出 行 两 次 。 其 原因 是 ， 
在 fork 之 前 调用 了 printf 一 次 ， 但 当 调 用 fork 时 ， 该 行 数 据 仍 在 缓冲 区 中 ， 然 后 在 将 父 进 
程 数据 空 间 复制 到 子 进 程 中 时 ， 该 缓冲 区 数据 也 被 复制 到 子 进 程 中 ， 此 时 父 进程 和 子 进 程 各 自 有 
了 带 该 行内 容 的 缓冲 区 。 在 exit 之 前 的 第 二 个 printf 将 其 数据 追加 到 已 有 的 缓冲 区 中 。 当 每 
个 进程 终止 时 ， 其 缓冲 区 中 的 内 容 都 被 写 到 相应 文件 中 。 "i 
文件 共享 
对 图 8-1 程序 需 注意 的 另 一 点 是 ， 在 重 定向 父 进 程 的 标准 输出 时 ， 子 进程 的 标准 输出 也 被 重 定向 。 
实际 上 ，fork 的 一 个 特性 是 父 进程 的 所 有 打开 文件 描述 符 都 被 复制 到 子 进程 中 。 我们 说 “复制 ” 
是 因为 对 每 个 文件 描述 符 来 说 ， 就 好 像 执 行 了 dup 函数 。 父 进程 和 子 进程 每 个 相同 的 打开 描述 符 
共享 一 个 文件 表 项 《〈 见 图 3-9)。 
考虑 下 述 情况 ,一 个 进程 具有 3 个 不 同 的 打开 文件 , 它们 是 标准 输入 、 标准 输出 和 标准 错误 。 
在 从 fork 返回 时 ， 我 们 有 了 如 图 8-2 中 所 示 的 结构 。 
重要 的 一 点 是 ， 父 进程 和 子 进程 共享 同一 个 文件 偏 移 量 。 考 虑 下 述 情况 : 一 个 进程 fork 
了 一 个 子 进 程 ， 然 后 等 待 子 进 程 终止 。 假 定 ， 作 为 普通 处 理 的 一 部 分 ， 父 进程 和 子 进 程 都 向 
标准 输出 进行 写 操作 。 如 果 父 进程 的 标准 输出 已 重 定向 〈 很 可 能 是 由 shell 实现 的 )， 那 么 子 
进程 写 到 该 标准 输出 时 ， 它 将 更 新 与 父 进程 共享 的 该 文件 的 偏 移 量 。 在 这 个 例子 中 ， 当 父 进 
程 等 待 子 进程 时 ， 子 进程 写 到 标准 输出 ， 而 在 子 进程 终止 后 ， 父 进程 也 写 到 标准 输出 上 ， 并 
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且 知 道 其 输出 会 追加 在 子 进程 所 写 数 据 之 后 。 如 果 父 进程 和 子 进程 不 共享 同一 文件 偏 移 量 ， 
要 实现 这 种 形式 的 交互 就 要 困难 得 多 ， 可 能 需要 父 进 程 显 式 地 动作 。 231 
父 进程 表 项 文件 表 


文件 状态 标志 
当前 文件 偏 移 重 
v 节点 指针 


文件 状态 标志 
当前 文件 偏 移 量 







文件 状态 标志 
当前 文件 偏 移 量 
v 节点 指针 





图 8-2 fork 之 后 父 进程 和 子 进程 之 间 对 打开 文件 的 共享 

如 果 父 进程 和 子 进程 写 同 一 描述 符 指向 的 文件 ， 但 又 没有 任何 形式 的 同步 《如 使 父 进程 等 待 
子 进程 )， 那 么 它们 的 输出 就 会 相互 混合 〈 假 定 所 用 的 描述 符 是 在 fork 之 前 打开 的 )。 虽 然 这 种 
情况 是 可 能 发 生 的 ( 见 图 8-2)， 但 这 并 不 是 常用 的 操作 模式 。 

在 fork 之 后 处 理 文件 描述 符 有 以 下 两 种 常见 的 情况 。 

(1) 父 进 程 等 待 子 进程 完成 。 在 这 种 情况 下 ， 父 进程 无 需 对 其 描述 符 做 任何 处 理 。 当 子 进程 
终止 后 ， 它 曾 进 行 过 读 、 写 操作 的 任 一 共享 描述 符 的 文件 偏 移 量 己 做 了 相应 更 新 。 

(2) 父 进 程 和 子 进程 各 自 执行 不 同 的 程序 段 。 在 这 种 情况 下 ， 在 fork 之 后 ， 父 进程 和 子 进 
程 各 自 关 闭 它 们 不 需 使 用 的 文件 描述 符 ， 这 样 就 不 会 干扰 对 方 使 用 的 文件 描述 符 。 这 种 方法 是 网 
络 服务 进程 经 常 使 用 的 。 

除了 打开 文件 之 外 ， 父 进程 的 很 多 其 他 属性 也 由 子 进程 继承 ， 包 括 : 

e 实际 用 户 ID、 实 际 组 ID、 有 效用 户 ID、 有 效 组 ID 

e 附属 组 ID 

。 进程 组 ID 
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Zii ID 

控制 终端 

REAP ID 标志 和 设置 组 ID 标志 
当前 工作 目录 

根 目录 

文件 模式 创建 屏蔽 字 

信号 屏蔽 和 安排 

对 任 一 打开 文件 描述 符 的 执行 时 关闭 Celose-on-exec) 标志 
环境 

连接 的 共享 存储 段 

存储 映像 

资源 限制 

父 进 程 和 子 进程 之 间 的 区 别 具 体 如 下 。 

e fork 的 返回 值 不 同 。 

e 进程 ID 不 同 。 

e 这 两 个 进程 的 父 进程 ID Ai: 子 进程 的 父 进程 ID 是 创建 它 的 进程 的 ID， 而 父 进程 

的 父 进程 ID 则 不 变 。 
e 子 进 程 的 tms_utime、tms_stime、tms_cutime 和 tms ustime 的 值 设置 为 0 GX 
些 时 间 将 在 8.17 节 中 介绍 )。 

e 子 进程 不 继承 父 进程 设置 的 文件 锁 。 

。 子 进程 的 未 处 理 闹 钟 被 清除 。 

© 子 进 程 的 未 处 理 信号 集 设置 为 空 集 。 

其 中 很 多 特性 至 今 尚 未 讨论 过 ， 我 们 将 在 以 后 几 章 中 对 它们 进行 说 明 。 

使 fork 失败 的 两 个 主要 原因 是 : GO 系统 中 已 经 有 了 太 多 的 进程 (通常 意味 着 某 个 方面 出 
了 问题 )，(b) 该 实际 用 户 ID 的 进程 总 数 超过 了 系统 限制 。 回 忆 图 2-11， 其 中 CHILD_MAX 规定 
了 每 个 实际 用 户 ID 在 任 一 时 刻 可 拥有 的 最 大 进程 数 。 

fork 有 以 下 两 种 用 法 。 

(1) 一 个 父 进程 希望 复制 自己 ， 使 父 进程 和 子 进程 同时 执行 不 同 的 代码 段 。 这 在 网 络 服 
务 进 程 中 是 常见 的 父 进程 等 待 客 户 端的 服务 请 求 。 当 这 种 请 求 到 达 时 ， 父 进程 调用 fork, 
使 子 进程 处 理 此 请 求 。 父 进程 则 继续 等 待 下 一 个 服务 请 求 。 

(2) 一 个 进程 要 执行 一 个 不 同 的 程序 。 这 对 shell 是 常见 的 情况 。 在 这 种 情况 下 ， 子 进程 从 

fork 返回 后 立即 调用 exec (RIKE 8.10 节 说 明 exec). 

某 些 操作 系统 将 第 2 种 用 法 中 的 两 个 操作 (fork 之 后 执行 exec) 组 合成 一 个 操作 ， 称 为 
spawn. UNIX 系统 将 这 两 个 操作 分 开 , 因为 在 很 多 场合 需要 单独 使 用 fork, 其 后 并 不 跟随 exec. 
另外 ， 将 这 两 个 操作 分 开 ， 使 得 子 进程 在 fork 和 exec 之 间 可 以 更 改 自己 的 属性 ， 如 UO EE 
向 、 用 户 ID、 信 号 安排 等 。 在 第 15 章 中 有 很 多 这 方面 的 例子 。 

Single UNIX Specification 在 高 级 实时 选项 组 中 确实 包括 了 spawn 接口 。 但 是 该 接口 并 不 想 替 
| # fork 和 exec。 它们 的 目的 是 支持 难于 有 效 实现 fork 的 系统 ,特别 是 对 存储 管理 缺少 硬件 支 
” 持 的 系统 。 


^ 
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8.4 函数 vfork 


vfork 范 数 的 调用 序列 和 返回 值 与 fork 相同 ， 但 两 者 的 语义 不 同 。 


vfork 起 源 于 较 早 的 2.9BSD。 有 些 人 认为 ， 该 函数 是 有 瑕 疫 的 。 但 是 本 书 讨论 的 4 种 平台 

' 都 支持 它 。 事 实 上 ，BSD 的 开发 者 在 4.4BSD PMR TADR, 但 4.4BSD 派生 的 所 有 开放 源码 

: BSD 版 本 又 将 其 收回 。 在 SUSv3 中 ，vfork 被 标记 为 齐 用 的 接口 ， 在 SUSv4 中 被 完全 删除 。 我 
们 只 是 由 于 历史 的 原因 还 是 把 它 包 含 进来 。 可 移植 的 应 用 程序 不 应 该 使 用 这 个 函数 。 


vfork 函数 用 于 创建 一 个 新 进程 ， 而 该 新 进程 的 目的 是 exec 一 个 新 程序 (如 上 一 节 末 
尾 的 (2) 中 一 样 )。 图 1-7 程序 中 的 shell 基本 部 分 就 是 这 类 程序 的 一 个 例子 。vfork 与 fork 
一 样 都 创建 一 个 子 进程 , 但 是 它 并 不 将 父 进程 的 地 址 空间 完全 复制 到 子 进程 中 ,因为 子 进程 
会 立即 调用 exec (R exit), 于 是 也 就 不 会 引用 该 地 址 空间 。 不 过 在 子 进程 调用 exec 或 
exit 之 前 ， 它 在 父 进程 的 空间 中 运行 。 这 种 优化 工作 方式 在 某 些 UNIX 系统 的 实现 中 提高 
了 效率 ,但 如 果子 进程 修改 数据 (除了 用 于 存放 vfork 返回 值 的 变量 )、 进 行 函数 调用 、 或 
者 没有 调用 exec 或 exit 就 返回 都 可 能 会 带 来 未 知 的 结果 。( 就 像 上 一 节 中 提 及 的 ， 实 现 
采用 写 时 复制 技术 以 提高 fork 之 后 跟随 exec 操作 的 效率 , 但 是 不 复制 比 部 分 复制 还 是 要 
快 一 些 。) 

vfork 和 fork 之 间 的 另 一 个 区 别 是 : vfork 保证 子 进程 先 运 行 ， 在 它 调 用 exec R exit 
之 后 父 进 程 才 可 能 被 调度 运行 ， 当 子 进程 调用 这 两 个 函数 中 的 任意 一 个 时 ， 父 进程 会 恢复 运行 。 
《如 果 在 调用 这 两 个 函数 之 前 子 进程 依赖 于 父 进程 的 进一步 动作 ， 则 会 导致 死 锁 。) 


£ 实例 


8-3 中 的 程序 是 图 8-1 中 的 程序 的 修改 版 ， 其 中 用 vfork 代替 了 fork， 删 除了 对 于 标准 
输出 的 write 调用 。 另 外 ， 我 们 也 不 再 需要 让 父 进程 调用 sleep， 因 为 我 们 可 以 保证 ， 在 子 进 
程 调 用 exec 或 exit 之 前 ， 内 核 会 使 父 进程 处 于 休眠 状态 。 234 


#include "apue.h" 
int globvar = 6; /* external variable in initialized data */ 
int 


main(void) 


{ 


int var; /* automatic variable on the stack */ 
pid t pid; | 
var = 88; 


printf ("before vfork\n"); /* we don't flush stdio */ 
if ((pid = vfork()) < O) ( 
err sys("vfork error"); 
} else if (pid == 0) { /* child */ 
globvar++; /* modify parent's variables */ 
vartt; 
_exit (0); /* child terminates */ 
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/* parent continues here */ 
printf ("pid = tid, glob = td, var = #d\n", (long)getpid(), globvar, 
var); 


exit (0); 
} 
8-3 vfork 函数 实例 
运行 该 程序 得 到 : 
$.1a.out 


before vfork 
pid = 29039, glob = 7, var = 89 


子 进 程 对 变量 做 增 1 的 操作 ， 结 果 改 变 了 父 进程 中 的 变量 值 。 因 为 子 进程 在 父 进程 的 地 址 空 
闻 中 运行 ， 所 以 这 并 不 令 人 惊讶 。 但 是 其 作用 的 确 与 fork 不 同 。 
注意 ， 在 图 8-3 程序 中 ， 调 用 了 _exit 而 不 是 exit。 正 如 7.3 节 所 述 ，_exit 并 不 执行 标准 IO 
缓冲 区 的 冲洗 操作 。 如 果 调 用 的 是 exit 而 不 是 exit, 则 该 程序 的 输出 是 不 确定 的 。 它 依赖 于 标准 O 
库 的 实现 ， 我 们 可 能 会 看 到 输出 没有 发 生变 化 ， 或 者 发 更 没有 出 现 父 进程 的 Printf 输出 。 
如 果子 进程 调用 exit， 实 现 冲 洗 标准 VO 流 。 如 果 这 是 函数 库 采 取 的 唯一 动作 ， 那 么 我 们 
会 见 到 这 样 操作 的 输出 与 子 进程 调用 _exit 所 产生 的 输出 完全 相同 ， 没 有 任何 区 别 。 如 果 该 实现 
也 关闭 标准 IO 流 ， 那 么 表示 标准 输出 FILE 对 象 的 相关 存储 区 将 被 清 0。 因 为 子 进程 借用 了 父 
进程 的 地 址 空间 ， 所 以 当 父 进程 恢复 运行 并 调用 printf 时 ， 也 就 不 会 产生 任何 输出 ，printf 
返回 -1。 注意 ， 父 进程 的 STDOUT_FILENO 仍然 有 效 ， 子 进程 得 到 的 是 父 进程 的 文件 描述 符 数组 
的 副本 参见 图 8-2)。 
大 多 数 exit 的 现代 实现 不 再 在 流 的 关闭 方面 自 找 麻 烦 。 因 为 进程 即将 终止 ， 那 时 内 核 
.将 关闭 在 进程 中 已 打 开 的 所 有 文件 描述 符 。 在 库 中 关闭 这 些 , 只 是 增加 了 开销 而 不 会 带 来 任 
| 何 益处 。 a 
McKusick 等 [1996] 的 5.6 节 中 包含 了 fork Mvfork 实现 方面 的 更 多 信息 。 习 题 8.1 和 习题 
82 将 继续 对 v£ork 进行 讨论 。 


8.5 AX exit 


如 7.3 节 所 述 ， 进 程 有 5 种 正常 终止 及 3 种 异常 终止 方式 。5 种 正常 终止 方式 具体 如 下 。 

(1) Æ main 函数 内 执行 return 语句 。 如 在 7.3 节 中 所 述 ， 这 等 效 于 调用 exit. 

(2) 调用 exit 函数 。 此 函数 由 ISO C 定义 ， 其 操作 包括 调用 各 终止 处 理 程 序 〈 终 止 处 理 程 
序 在 调用 atexit 函数 时 登记 )， 然 后 关闭 所 有 标准 VO 流 等 。 因 为 ISO C 并 不 处 理 文件 描述 符 、 
多 进程 〈 父 进程 和 子 进 程 ) 以 及 作业 控制 ， 所 以 这 一 定义 对 UNIX 系统 而 言 是 不 完整 的 。 

(3) 调用 exit 或 Exit AM. ISOC 定义 _Exit， 其 目的 是 为 进程 提供 一 种 无 需 运 行 终止 
处 理 程序 或 信号 处 理 程 序 而 终止 的 方法 。 对 标准 VO 流 是 否 进行 冲洗 ， 这 取决 于 实现 。 在 UNIX 
系统 中 ，_Exit Wl exit 是 同 义 的 ， 并 不 冲洗 标准 UO S. exit 函数 由 exit WA, CAH 
UNIX 系统 特定 的 细节 。_exit 是 由 POSIX.1 说 明 的 。 


&X $4 UNIX 系统 实现 中 ，exit(3) 是 标准 C 库 中 的 一 个 函数 ， 而 _exit(2) 则 是 一 个 
系统 调用 。 
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(4) 进程 的 最 后 一 个 线程 在 其 启动 例 程 中 执行 return 语句 。 但 是 ， 该 线程 的 返回 值 不 用 作 
进程 的 返回 值 。 当 最 后 一 个 线程 从 其 启动 例 程 返回 时 ， 该 进程 以 终止 状态 0 返回 。 

(5) 进程 的 最 后 一 个 线程 调用 pthread exit 函数 。 如 同 前 面 一 样 ， 在 这 种 情况 中 ， 进 程 
终止 状态 总 是 0, 这 与 传送 给 pthread exit 的 参数 无 关 。 在 11.5 节 中 ,我 们 将 对 pthread exit 
做 更 多 说 明 。 

3 种 异常 终止 具体 如 下 。 

(1) 调用 abort。 它 产生 SIGABRT 信和 号， 这 是 下 一 种 异常 终止 的 一 种 特例 。 

(2) 当 进 程 接收 到 某 些 信号 时 。〈 第 10 章 将 较 详 细 地 说 明 信 号 。〉 信 号 可 由 进程 自身 (如 调用 
abort 函数 )、 其 他 进程 或 内 核 产 生 。 例 如 ， 若 进程 引用 地 址 空间 之 外 的 存储 单元 、 或 者 除 以 0， 
内 核 就 会 为 该 进程 产生 相应 的 信号 。 

(3) 最 后 一 个 线程 对 “取消 ”canceliation) 请 求 作出 响应 。 上 默认 情况 下 ,“ 了 到 消 ” 以 延迟 方 
ARE: 一 个 线程 要 求 取 消 另 一 个 线程 ， 着 干 时 间 之 后 ， 目 标 线程 终止 。 在 11.5 节 和 12.7 节 ， 
我 们 将 详细 讨论 “取消 ”请 求 。 

不 管 进程 如 何 终 止 ， 最 后 都 会 执行 内 核 中 的 同一 段 代 码 。 这 段 代 码 为 相应 进程 关闭 所 有 打开 
描述 符 ， 释 放 它 所 使 用 的 存储 器 等 。 

对 上 述 任意 一 种 终止 情形 ， 我 们 都 希望 终止 进程 能 够 通知 其 父 进 程 它 是 如 何 终 止 的 。 对 于 3 
个 终止 函数 Cexit. exit 和 _Exit)， 实 现 这 一 点 的 方法 是 ， 将 其 退出 状态 (exit status) 作为 
参数 传送 给 函数 。 在 异常 终止 情况 ， 内 核 〈 不 是 进程 本 身 ) 产生 一 个 指示 其 异常 终止 原因 的 终止 
状态 (termination status)。 在 任意 一 种 情况 下 ， 该 终止 进程 的 父 进程 都 能 用 wait MR waitpid PH 
数 〈 将 在 下 一 节 说 明 ) 取得 其 终止 状态 。 

注意 ， 这 里 使 用 了 “退出 状态 ”和 它 是 传递 给 向 3 个 终止 函数 的 参数 ， 或 main 的 返回 值 》 
和 “终止 状态 ”两 个 术语 ， 以 表示 有 所 区 别 。 在 最 后 调用 _exit 时 ， 内 核 将 退出 状态 转换 成 终止 
状态 《回忆 图 7-2). Al 8-4 说 明 父 进程 检查 子 进程 终止 状态 的 不 同方 法 。 如 果子 进程 正常 终止 ， 
则 父 进程 可 以 获得 子 进程 的 退出 状态 。 

在 说 明 fork 函数 时 ， 显 而 易 见 ， 子 进程 是 在 父 进程 调用 fork 后 生成 的 。 上 面 又 说 明了 子 
进程 将 其 终止 状态 返回 给 父 进 程 。 但 是 如 果 父 进程 在 子 进程 之 前 终止 ， 又 将 如 何 昵 ? HSE: 
对 于 父 进程 已 经 终止 的 所 有 进程 ， 它 们 的 父 进程 都 改变 为 init 进程 。 我 们 称 这 些 进 程 由 init 
进程 收养 。 其 操作 过 程 大 致 是: 在 一 个 进程 终止 时 ， 内 核 逐 个 检查 所 有 活动 进程 ， 以 判断 它 是 否 
是 正 要 终止 进程 的 子 进程 ， 如 果 是 ， 则 该 进程 的 父 进程 ID 就 更 改 为 1 (init 进程 的 ID)。 这 种 
处 理 方 法 保证 了 每 个 进程 有 一 个 父 进 程 。 

另 一 个 我 们 关心 的 情况 是 ， 如 果子 进程 在 父 进程 之 前 终止 ， 那 么 父 进程 又 如 何 能 在 做 相 
应 检查 时 得 到 子 进程 的 终止 状态 呢 ? 如 果子 进程 完全 消失 了 ， 父 进程 在 最 终 准 备 好 检查 子 进 
程 是 否 终 止 时 是 无 法 获取 它 的 终止 状态 的 。 内 核 为 每 个 终止 子 进程 保存 了 一 定量 的 信息 ， 所 
以 当 终 止 进程 的 父 进程 调用 wait 或 waitpid Bj. 可 以 得 到 这 些 信 息 。 这 些 信 息 至 少 包括 进 
程 ID、 该 进程 的 终止 状态 以 及 该 进程 使 用 的 CPU 时 间 总 量 。 内 核 可 以 释放 终止 进程 所 使 用 的 
所 有 存储 区 ， 关 闭 其 所 有 打开 文件 。 在 UNIX 术语 中 ， 一 个 己 经 终止 、 但 是 其 父 进程 尚未 对 
其 进行 善后 处 理 ( 获 取 终 止 子 进程 的 有 关 信 息 、 释 放 它 仍 上 右 用 的 资源 〉 的 进程 被 称 为 盆 死 进 
42 (zombie)。ps(1) 命 令 将 价 死 进程 的 状态 打印 为 Z。 如 果 编 写 一 个 长 期 运行 的 程序 , E fork 
了 很 多 子 进 程 ， 那 么 除非 父 进 程 等 待 取得 子 进程 的 终止 状态 ， 不 然 这 些 子 进程 终止 后 就 会 变 
FM BSE HE FE 
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535 | 某 些 系统 提供 了 一 种 避免 产生 僵 死 进程 的 方法 ， 这 将 在 10.7 中 介绍 。 


最 后 一 个 要 考虑 的 问题 是 : 一 个 由 init 进程 收养 的 进程 终止 时 会 发 生 什 么 ? 它 会 不 会 变 成 
一 个 僵 死 进程 ? 对 此 问题 的 回答 是 “和 否 ”， 因 为 init 被 编写 成 无 论 何 时 只 要 有 一 个 子 进程 终止 ， 
init 就 会 调用 一 个 wait 函数 取得 其 终止 状态 。 这 样 也 就 防止 了 在 系统 中 塞 满 僵 死 进程 。 当 提 
及 “一 个 init 的 子 进程 ”时 ， 这 指 的 可 能 是 init 直接 产生 的 进程 (如 将 在 92 节 说 明 的 getty 
进程 )， 也 可 能 是 其 父 进程 已 终止 ， 由 init 收养 的 进程 。 


8.6 Pa wait fl waitpid 


当 一 个 进程 正常 或 异常 终止 时 ， 内 核 就 向 其 父 进程 发 送 SIGCHLD 信号 。 因 为 子 进程 终止 是 
个 异步 事件 〈 这 可 以 在 父 进程 运行 的 任何 时 候 发 生 )， 所 以 这 种 信号 也 是 内 核 向 父 进程 发 的 异步 
通知 。 父 进程 可 以 选择 忽略 该 信号 ， 或 者 提供 一 个 该 信号 发 生 时 即 被 调用 执行 的 函数 《〈 信 和 号 处 理 
程序 )。 对 于 这 种 信和 号 的 系统 默认 动作 是 忽略 它 。 第 10 章 将 说 明 这 些 选 项 。 现 在 需要 知道 的 是 调 
Fl wait E waitpid 的 进程 可 能 会 发 生 什么 。 

e 如 果 其 所 有 子 进程 都 还 在 运行 ， 则 阻塞 。 

。 如 果 一 个 子 进程 已 终止 , 正 等 待 父 进程 获取 其 终止 状态 , 则 取得 该 子 进程 的 终止 状态 立即 返回 。 

。 如 果 它 没有 任何 子 进程 ， 则 立即 出 错 返 回 。 

如 果 进 程 由 于 接收 到 SIGCHLD 信号 而 调用 wait, 我 们 期 望 wait 会 立即 返回 。 但 是 如 果 在 
随机 时 间 点 调用 wait， 则 进程 可 能 会 阻塞 。 


#include <sys/wait.h> 


pid t wait(int *statloc); 


pid t waitpid(pid t pid, int *statloc, int options); 


两 个 函数 返回 值 : 若 成 功 ， 返 回 进程 ID， 若 出 错 ， 返 回 0《 见 后 面 的 说 明 》 或 -1 





这 两 个 函数 的 区 别 如 下 。 

e 在 一 个 子 进程 终止 前 , wait 使 其 调用 者 阻塞 , 而 waitpid 有 一 选项 , 可 使 调用 者 不 阻塞 。 

。 waitpid 并 不 等 待 在 其 调用 之 后 的 第 一 个 终止 子 进程 ， 它 有 若干 个 选项 ， 可 以 控制 它 所 

等 待 的 进程 。 

如 果子 进程 已 经 终止 ， 并 且 是 一 个 僵 死 进程 ， 则 wait 立即 返回 并 取得 该 子 进程 的 状态 ， 否 
则 wait 使 其 调用 者 阻塞 ， 直 到 一 个 子 进程 终止 。 如 调用 者 阻塞 而 且 它 有 多 个 子 进 程 ， 则 在 其 某 
一 子 进程 终止 时 ，wait 就 立即 返回 。 因 为 wait 返回 终止 子 进程 的 进程 ID， 所 以 它 总 能 了 解 是 

哪 一 个 子 进 程 终 止 了 。 

这 两 个 函数 的 参数 statloc 是 一 个 整 型 指针 。 如 果 statloc 不 是 一 个 空 指 针 ， 则 终止 进程 的 终止 
状态 就 存放 在 它 所 指向 的 单元 内 。 如 果 不 关心 终止 状态 ， 则 可 将 该 参数 指定 为 空 指 针 。 

依据 传统 ， 这 两 个 函数 返回 的 整 型 状态 字 是 由 实现 定义 的 。 其 中 某 些 位 表示 退出 状态 (正常 
返回 ), 其 他 位 则 指示 信号 编号 (异常 返回 )， 有 一 位 指示 是 否 产 生 了 core 文件 等 。 POSIX.1 规定 ， 
终止 状态 用 定义 在 <sys /wait .h> 中 的 各 个 宏 来 查看 。 有 4 个 互 斥 的 宏 可 用 来 取得 进程 终止 的 原 
Al, 它们 的 名 字 都 以 WIF 开始 。 基于 这 4 个 宏 中 哪 一 个 值 为 真 , 就 可 选用 其 他 宏 来 取得 退出 状态 、 
信和 号 编号 等 。 这 4 个 互 斥 的 宏 示 于 图 8-4 H. 
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若 为 正常 终止 子 进程 返回 的 状态 ， 则 为 真 。 对 于 这 种 情况 可 执行 
WEXITSTATUS(status)， 获 取 子 进程 传送 给 exit 或 exit 参数 的 低 8 位 

WIFSIGNALED (status) 若 为 异常 终止 子 进程 返回 的 状态 ， 则 为 与 〈 接 到 一 个 不 捕捉 的 信号 )。 对 于 这 

种 情况 ， 可 执行 WTERMSIG(status)， 获 取 使 子 进程 终止 的 信号 编号 。 另 外 ， 有 


些 实现 ( 非 Single UNIX Specification) xz X2€ WCOREDUMP(status), 3$ 07^ 
终止 进程 的 core 文件 ， 则 它 返 回 真 


车 为 当前 暂停 子 进程 的 返回 的 状态 ， 则 为 真 。 对 于 这 种 情况 ， 可 执行 
WSTOPSIG(status)， 获 取 使 子 进程 暂停 的 信号 编号 


车 在 作业 控制 暂停 后 已 经 继续 的 子 进程 返回 了 状态 ， 则 为 真 POSIX.1 的 XSI 
扩展 ; MAF waitpid) 


8-4 检查 wait Ñ waitpid 所 返回 的 终止 状态 的 宏 
在 9.8 节 中 讨论 作业 控制 时 ， 将 说 明 如 何 停止 一 个 进程 。 












wa 实例 


图 8-5 中 的 函数 pr_exit 使 用 图 8-4 中 的 宏 以 打印 进程 终止 状态 的 说 明 。 本 书 中 的 很 多 程序 
都 将 调用 此 函数 。 注 意 ， 如 果 定 义 了 WCOREDUMP 宏 ， 则 此 函数 也 处 理 该 宏 。 


include "apue.h" 
#include <sys/wait.h> 


void 
pr exit(int status) 


{ 


if (WIFEXITED(status) ) 
printf ("normal termination, exit status = td\n", 
WEXITSTATUS (status) ); 
else if (WIFSIGNALED(status) ) 
printf ("abnormal termination, signal number = %d%s\n", 
WTERMSIG (status), 


#ifdef | WCOREDUMP 


WCOREDUMP (status) ? " (core file generated)" : ""); 


felse 


aad ed 


fendif 


else if (WIFSTOPPED(status)) 
printf("child stopped, signal number = %d\n", 
WSTOPSIG(status)): 


图 8-5 打印 exit 状态 的 说 明 


FreeBSD 8.0. Linux 3.2.0, Mac OS X 10.6.8 以 及 Solaris 10 都 支持 WCOREDUMP 宏 。 但 是 如 果 


| KT POSIX C SOURCE 常量 ， 有 些 乎 台 就 隐藏 这 个 定义 《回忆 2.7 F )。 
8-6 中 程序 调用 pr exit 函数 ， 演 示 终 止 状态 的 各 种 值 。 





#include "apue.h" 
#include <sys/wait.h> 


int 
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main (void) 

{ 
pid_t pid; 
int status; 


if ({pid = fork()) < 0) 
err sys("fork error"); 


else if (pid == 0) /* child */ 
exit(7); 
if (wait(&status) !- pid) /* wait for child */ 
err sys("wait error"); 
pr exit(status); /* and print its status */ 


if ((pid = fork()) < 0) 
err sys("fork error"); 


else if (pid == 0) /* child */ 
abort(); /* generates SIGABRT */ 
if (waití(&status) != pid) /* wait for child */ 
err sys("wait error"); 
pr_exit (status); /* and print its status */ 


if ((pid = fork()) < 0) 
err_sys("fork error"); 


else if (pid == 0) /* child */ 
status /= 0; /* divide by 0 generates SIGFPE */ 
if (wait(&status) !- pid) /* wait for child */ 
err sys("wait error"); 
pr exit(status); /* and print its status */ 
exit (0); 


8-6 ”演示 不 同 的 exit fü 
运行 该 程序 可 得 : 
$ ./a.out 
normal termination, exit status = 7 


abnormal termination, signal number 6 (core file generated) 
abnormal termination, signal number = 8 (core file generated) 


现在 ， 我 们 可 以 从 WTERMSIG 中 打印 信号 编号 。 可 以 查看 <signal .h> 头 文件 验证 SIGABRT 的 
值 为 6，SIGFPE 的 值 为 8。 我们 将 在 10.22 节 中 看 到 一 种 可 移植 的 方式 进行 信号 编号 到 说 明 性 名 
字 的 映射 。 u 
正如 前 面 所 述 ， 如 果 一 个 进程 有 儿 个 子 进程 ， 那 么 只 要 有 一 个 子 进程 终止 ，wait 就 返回 
如 果 要 等 待 一 个 指定 的 进程 终止 (如 果 知 道 要 等 待 进程 的 ID ), 那么 该 如 何 做 昵 ? 在 早期 的 UNIX 
版 本 中 ， 必 须 调 用 wait， 然 后 将 其 返回 的 进程 ID 和 所 期 望 的 进程 ID 相 比较 。 如 果 终 止 进程 不 
是 所 期 望 的 ， 则 将 该 进程 ID 和 终止 状态 保存 起 来 ， 然 后 再 次 调用 wait。 反 复 这 样 做， 直到 所 期 
望 的 进程 终止 。 下 一 次 又 想 等 待 一 个 特定 进程 时 ， 先 查看 已 终止 的 进程 列表 ， 若 其 中 已 有 要 等 待 
的 进程 ， 则 获取 相关 信息 ; 否则 调用 wait. 其实 , 我们 需要 的 是 等 待 一 个 特定 进程 的 图 数 。POSIX. 
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定义 了 waitpid 函数 以 提供 这 种 功能 〈 以 及 其 他 一 些 功 能 )。 
对 于 waitpid 函数 中 pid 参数 的 作用 解释 如 下 。 
pi 一 -1 等待 任 一 子 进程 。 此 种 情况 下 ，waitpid 与 wait SM. 
pid>0 等 待 进程 ID 与 pid 相等 的 子 进 程 。 
Pid 一 0 FRA ID 等 于 调用 进程 组 ID 的 任 一 子 进程 。(9.4 节 将 说 明 进程 组 。) 240 
pid «-1 等 待 组 ID 等 于 pid 绝对 值 的 任 一 子 进程 。 l 
waitpid 函数 返回 终止 子 进程 的 进程 ID， 并 将 该 子 进程 的 终止 状态 存放 在 由 statioc 指向 的 CA 
存储 单元 中 。 对 于 wait， 其 唯一 的 出 错 是 调用 进程 没有 子 进程 〈 函 数 调 用 被 一 个 信和 号 中 断 时 ， 
也 可 能 返回 另 一 种 出 错 。 第 10 章 将 对 此 进行 讨论 )。 但 是 对 于 waitpid， 如 果 指 定 的 进程 或 进程 
组 不 存在 ， 或 者 参数 pid 指定 的 进程 不 是 调用 进程 的 子 进程 ， 都 可 能 出 错 。 
options 参数 使 我 们 能 进一步 控制 waitpid 的 操作 。 此 参数 或 者 是 0， 或 者 是 图 8-7 中 常量 
按 位 或 运算 的 结果 。 


| FreeBSD 8.0 和 Solaris 10 支持 另 一 个 非 标 准 的 可 选 常量 WNOWAIT, 它 使 系统 将 终止 状态 已 由 
| waitpid 返回 的 进程 保持 在 等 待 状态 ， 这 样 它 可 被 再 次 等 待 。 


若 实现 支持 作业 控制 ， 那 么 由 pid 指定 的 任 一 子 进 程 在 停止 后 已 经 继续 ， 但 其 状态 尚 


未 报告 ， 则 返回 其 状态 〈(POSIX.1 的 XSI 扩展 ) 


WNOHANG — | 者 由 pi 指定 的 子 进程 并 不 是 立即 可 用 的 ， 则 waitpid 不 阻塞 ， 此 时 其 返回 值 为 0 

WUNTRACED 若 某 实 现 支持 作业 控制 ， 而 由 pid 指定 的 任 一 子 进程 已 处 于 停止 状态 ， 并 且 其 状态 自 
停止 以 来 还 未 报告 过 ， 则 返回 其 状态 。WIFSTOPPED 宏 确定 返回 值 是 否 对 应 于 一 个 停止 
的 子 进程 





图 8-7 waitpid 的 options 常量 
waitpid 范 数 提供 了 wait 函数 没有 提供 的 3 个 功能 。 
(Dwaitpid 可 等 待 一 个 特定 的 进程 ,而 wait 则 返回 任 一 终止 子 进程 的 状态 。 在 讨论 popen 
函数 时 会 再 说 明 这 一 功能 。 
(2) waitpid 提供 了 一 个 wait 的 非 阻塞 版 本 。 有 时 希望 获取 一 个 子 进程 的 状态 ， 但 不 
想 阻塞 。 
(3) waitpid 通过 WUNTRACED 和 WCONTINUED 选项 支持 作业 控制 。 


旦 实例 

回忆 8.5 节 中 有 关 僵 死 进程 的 讨论 。 如 果 一 个 进程 fork 一 个 子 进 程 ， 但 不 要 它 等 待 子 进程 
终止 ， 也 不 希望 子 进程 处 于 僵 死 状态 直到 父 进程 终止 ， 实 现 这 一 要 求 的 诀窍 是 调用 fork AK. 
8-8 程序 实现 了 这 一 点 。 242 
本 
#include «sys/wait.h» 
int 
main (void) 


1 
pid t pid; 
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if ((pid = fork()) < 0) ( 
err sys("fork error"); 
) else if (pid == 0) { /* first child */ 
if ((pid = fork()) < O0) 
err sys("fork error"); 
else if (pid > Q0) 
exit(0); /* parent from second fork -- first child */ 


/* 
* We're the second child; our parent becomes ínit as soon 
* as our real parent calls exit() in the statement above. 
* Here's where we'd continue executing, knowing that when 
* we're done, init will reap our status. 
*/ 
sleep(2); 
printf ("second child, parent pid = %ld\n", (long)getppid()): 
exit (0); 
} 


if (waitpid(pid, NULL, 0) != pid) /* wait for first child */ 
err sys("waitpid error"); 


/* 

* We're the parent (the original process); we continue executing, 
* knowing that we're not the parent of the second child. 

*/ 

exit (0) ; 


8-8 fork 两 次 以 避免 僵 死 进程 
第 二 个 子 进程 调用 sleep 以 保证 在 打印 父 进程 ID 时 第 一 个 子 进程 已 终止 。 在 fork 之 后 ， 
父 进程 和 子 进程 都 可 继续 执行 ， 并 且 我 们 无 法 预知 哪 一 个 会 先 执行 。 在 fork 之 后 ， 如 果 不 使 第 
二 个 子 进 程 休眠 ， 那 么 它 可 能 比 其 父 进 程 先 执 行 ， 于 是 它 打印 的 父 进程 D 将 是 创建 它 的 父 进程 ， 
而 不 是 init 进程 (进程 D1). 


执行 图 8-8 程序 得 到 : 
S ./a.out 


$ second child, parent pid = 1 


注意 ， 当 原先 的 进程 《也 就 是 exec 本 程序 的 进程 ) 终止 时 ，shell 打印 其 提示 符 ， 这 在 第 二 个 子 
进程 打印 其 父 进程 ID 之 前 。 a 


8.7 Hi waitid 


Single UNIX Specification 包括 了 另 一 个 取得 进程 终止 状态 的 函数 一 一 waitid， 此 函数 类 似 
于 waitpid， 但 提供 了 更 多 的 灵活 性 。 


#include <sys/wait.h> 


int waitid(idtype t idtype, id t id, siginfo t *infop, int options); 


返回 值 ; X, 返回 0; 车 出 错 ， 返回 -1 
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与 waitpid 相似 ，waitid 允许 一 个 进程 指定 要 等 待 的 子 进程 。 但 它 使 用 两 个 单独 的 参数 
表示 要 等 待 的 子 进程 所 属 的 类 型 ， 而 不 是 将 此 与 进程 ID 或 进程 组 ID 组 合成 一 个 参数 。id 参数 的 
作用 与 idtype 的 值 相 关 。 该 函数 支持 的 idtype 类 型 列 在 图 8-9 P. 


说 明 
等 待 一 特定 进程 ，id 包含 要 等 待 子 进程 的 进程 ID 


等 待 一 特定 进程 组 中 的 任 一 子 进程 ，id 包含 要 等 待 子 进 程 的 进程 组 ID 
SHE THR: Me id 


8-9 waitid 的 idtype BE 
options 参数 是 图 8-10 中 各 标志 的 按 位 或 运算 。 这 些 标 志 指示 调用 者 关注 哪些 状态 变化 。 





说 明 


等 待 一 进程 ， 它 以 前 曾 被 停止 ， 此 后 又 已 继续 ， 但 其 状态 尚未 报告 
等 待 已 退出 的 进程 


| SHRM | 
_WNOHANG | 如 无 可 用 的 子 进程 退出 状态 , 立即 返回 而 非 阻塞 OOOO OOO O O 
| TuS EEG: 该 子 进程 退出 状态 可 由 后 续 的 wait. waitid R waitpid 
图 8-10 waitid 的 options 常量 
WCONTINUED. WEXITED 或 WSTOPPED 这 3 个 常量 之 一 必须 在 options 参数 中 指定 。 
infop 参数 是 指向 siginfo 结构 的 指针 。 该 结构 包含 了 造成 子 进程 状态 改变 有 关 信 和 号 的 详细 
信息 。10.14 节 将 进一步 讨论 siginfo 结构 。 





本 书 讨论 的 4 种 平台 中 ，Linux 3.2.0、Mac OS X 10.6.8 和 Solaris 10 支持 waitid, 但 要 注意 
”的 是 ，Mac OS X 10.6.8 并 没有 设置 siginfo 结构 中 的 所 有 信息 。 


8.8 RBM wait3 Fl wait4 


大 多 数 UNIX 系 统 实现 提供 了 另外 两 个 函数 wait3 和 wait4。 历 史上 ,这 两 个 函数 是 从 UNIX 
系统 的 BSD 分 支 延 袭 下 来 的 。 它 们 提供 的 功能 比 POSIX.1 函数 wait. waitpid Ñ waitid 所 
提供 功能 的 要 多 一 个 ， 这 与 附加 参数 有 关 。 该 参数 允许 内 核 返 回 由 终止 进程 及 其 所 有 子 进程 使 用 
的 资源 概况 。 


#include «sys/types.h» 
#include <sys/wait.h> 
#include <sys/time.h> 
#include <sys/resource.h> 


pid t wait3(int *sfatlec, int options, struct rusage *rusage); 


pid t wait4(pid t pid, int *statloc, int options, struct rusage *rusage); 
两 个 函数 返回 值 : 若 成 功 ， 返 回 进 程 ID: 若 出错 ， 返 回 -1 
资源 统计 信息 包括 用 户 CPU 时 间 总 量 、 系 统 CPU 时 间 总 量 、 缺 页 次 数 、 接 收 到 信号 的 次 数 


等 。 有 关 细 节 请 参阅 getrusage(2) 手 册页 (这 种 资源 信息 与 7.11 节 中 所 述 的 资源 限制 不 同 )。 
图 8-11 列 出 了 各 个 wait 函数 所 支持 的 参数 。 
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Free Linux MacOSX Solaris 
BSD 8.0 32.0 10.6.8 10 


wait 


waitid 


waitpid 
wait3 
wait4 
8-11 不 同系 统 上 各 个 wait 辑 数 所 支持 的 参数 


Single UNIX Specification 的 早期 版 本 包括 wait3 BH, Æ SUSv2 中 ，wait3 被 移 到 了 遗留 
目录 下 ， 在 SUSv3 中 ， 则 删 去 了 wait3。 








8.9 ”竞争 条 件 


当 多 个 进程 都 企图 对 共享 数据 进行 某 种 处 理 ， 而 最 后 的 结果 又 取决 于 进程 运行 的 顺序 时 ， 我 
们 认为 发 生 了 竞争 条 件 (race condition)。 如 果 在 fork 之 后 的 某 种 逻辑 显 式 或 隐 式 地 依赖 于 在 
fork 之 后 是 父 进程 先 运行 还 是 子 进 程 先 运 行 ， 那 么 fork 函数 就 会 是 竞争 条 件 活跃 的 滋生 地 。 
通常 ， 我 们 不 能 预料 哪 一 个 进程 先 运行 。 即 使 我 们 知道 哪 一 个 进程 先 运行 ， 在 该 进程 开始 运行 后 

所 发 生 的 事情 也 依赖 于 系统 负载 以 及 内 核 的 调度 算法 。 

在 图 8-8 程序 中 ， 当 第 二 个 子 进程 打印 其 父 进程 ID 时 ， 我 们 看 到 了 一 个 潜在 的 竞争 条 件 。 如 果 第 
二 个 子 进程 在 第 一 个 子 进程 之 前 运行 ， 则 其 父 进 程 将 会 是 第 一 个 子 进程 。 但 是 ， 如 果 第 一 个 子 进程 先 运 
行 ,并 有 足够 的 时 间 到 达 并 执行 ex i c, 则 第 二 个 子 进程 的 父 进程 就 是 init。 即 使 在 程序 中 调用 sleep, 
也 不 能 保证 什么 。 如 果 系 统 负载 很 重 ， 那 么 在 sleep 返回 之 后 、 第 一 个 子 进程 得 到 机 会 运行 之 前 ， 第 
二 个 子 进程 可 能 恢复 运行 。 这 种 形式 的 问题 很 难 调试 ， 因 为 在 大 部 分 时 间 ， 这 种 问题 并 不 出 现 。 

如 果 一 个 进程 希望 等 待 一 个 子 进程 终止 ， 则 它 必须 调用 wait 函数 中 的 一 个 。 如 果 一 个 进程 
要 等 待 其 父 进程 终止 《如 图 8-8 程序 中 一 样 )， 则 可 使 用 下 列 形 式 的 循环 : 


while(getppid() != 1) 
sleep(1); 


这 种 形式 的 循环 称 为 轮 询 (polling)， 它 的 问题 是 浪费 了 CPU 时 间 ， 因 为 调用 者 每 隔 1 s 都 被 
唤醒 ， 然 后 进行 条 件 测试 。 

为 了 避免 竟 争 条 件 和 轮 询 ， 在 多 个 进程 之 间 需 要 有 某 种 形式 的 信号 发 送 和 接收 的 方法 。 在 
UNIX 中 可 以 使 用 信号 机 制 ， 在 10.16 节 将 说 明 它 在 解决 此 方面 问题 的 一 种 用 法 。 各 种 形式 的 进 
程 间 通 信 OPO 也 可 使 用 ， 在 第 15 章 和 第 17 章 将 对 此 进行 讨论 。 

在 父 进程 和 子 进程 的 关系 中 ， 和 常常 出 现下 述 情况 。 在 fork 之 后 ， 父 进程 和 子 进程 都 有 一 些 
事情 要 做 。 例 如 ， 父 进程 可 能 要 用 子 进程 ID 更 新 日 志文 件 中 的 一 个 记录 ， 而 子 进程 则 可 能 要 为 
父 进程 创建 一 个 文件 。 在 本 例 中 ， 要 求 每 个 进程 在 执行 完 它 的 一 套 初始 化 操作 后 要 通知 对 方 ， 并 
且 在 继续 运行 之 前 ， 要 等 待 另 一 方 完 成 其 初始 化 操作 。 这 种 情况 可 以 用 代码 描述 如 下 : 


#include "apue.h" 
TELL_WAIT (}; /* set things up for TELL_xxx & WAIT_xxx*/ 
if ((pid = fork()) < 0) { 
err Sys("fork error"); 
) else if (pid == 0) { /* child*/ 
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/* child does whatever is necessary ...*/ 


TELL, PARENT (getppid()); /* tell parent we're done*/ 
WAIT PARENT(); /* and wait for parent*/ 
/* and the child continues on its way ...*/ 
exit (0); 
} 
/* parent does whatever is necessary ...*/ 
TELL_CHILD (pid); /* tell child we're done*/ 
WAIT CHILD(); /* and wait for child*/ 
/* and the parent continues on its way ...*/ 
exit(0); 


假定 在 头 文件 apue.h 中 定义 了 需要 使 用 的 各 个 变量 。5 MAH TELLWAIT. TELL PARENT. 
TELL CHILD. WAIT PARENT 以 及 WAIT_CHILD 可 以 是 宏 ， 也 可 以 是 函数 。 

在 后 面 几 章 中 会 说 明 实 现 这 些 TELL A WALT 例 程 的 不 同方 法 : 10.16 节 中 说 明 使 用 信号 的 一 
种 实现 ， 图 15-7 程序 说 明 使 用 管道 的 一 种 实现 。 下 面 先 看 一 个 使 用 这 5 个 例 程 的 实例 。 


PE: 


图 8-12 程序 输出 两 个 字符 串 : 一 个 由 子 进 程 输出 ， 另 一 个 由 父 进程 输出 。 因 为 输出 依赖 于 内 
核 使 这 两 个 进程 运行 的 顺序 及 每 个 进程 运行 的 时 间 长 度 ， 所 以 该 程序 包含 了 一 个 竞争 条 件 。 


#include "apue.h" 
static void charatatime(char *); 


int 
main (void) 
{ 
pid_t pid; 


if (ipid = fork()) < 0) 1 
err_sys ("fork error"); 
} else if (pid == 0) { 
charatatime ("output from child\n"); 
} else { 
charatatime ("output from parent\n"); 
} 
exit (0); 
} 


static void 
charatatime (char *str) 


{ 


char *ptr; 

int C; 

setbuf (stdout, NULL); /* set unbuffered */ 
for (ptr = str; (c = *ptr++) !- 0; ) 


putc(c, stdout); 


8-12 ” 带 有 竞争 条 件 的 程序 
在 程序 中 将 标准 输出 设置 为 不 带 缓冲 的 ， 于 是 每 个 字符 输出 都 需 调 用 一 次 write. APRA 
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的 是 使 内 核能 尽 可 能 多 次 地 在 两 个 进程 之 间 进 行 切 换 ， 以 便 演 示 竞 争 条 件 。( 如 果 不 这 样 做 ， 可 


能 也 就 决 不 会 见 到 下 面 所 示 的 输出 。 没 有 看 到 具有 错误 的 输出 并 不 意味 着 竞争 条 件 不 存在 ， 这 只 


是 意味 着 在 此 特定 的 系统 上 未 能 见 到 它 .) 下 面 的 实际 输出 说 明 该 程序 的 运行 结果 是 会 改变 的 。 


S ./a.out 

ooutput from child 
utput from parent 
$ ./a.out 

ooutput from child 
utput from parent 
$ ./a.out 

output from child 
output from parent 


修改 图 8-12 中 的 程序 ， 使 其 使 用 TELL 和 wart 函数 ， 于 是 形成 了 图 8-13 中 的 程序 。 行 首 


标 以 + 号 的 行 是 新 增加 的 行 。 


#include "apue.h" 
static void charatatime(char *); 


int 
main (void) 
{ 
pid t pid; 


TELL_WAIT () ; 
if ({pid = fork()) < 0) { 


err_sys ("fork error"); 
} else if (pid == 0) { 


WAIT_PARENT () ; /* parent goes first*/ 
charatatime ("output from child\n"); 
) else ( 


charatatime("output from parent Nn"); 
TELL CHILD (pid); 
} 
exit(0); 
} 


static void 
charatatime (char *str) 
{ 


char “DEY; 

int c; 

setbuf(stdout, NULL); /* set unbuffered*/ 
for (ptr = str; (c = *ptr++) != 0; ) 


pute(c, stdout); 


图 8-13 ”修改 图 8-12 程序 以 避免 竞争 条 件 
运行 此 程序 则 能 得 到 所 预期 的 输出 一 一 两 个 进程 的 输出 不 再 交叉 混合 。 
8-13 中 的 程序 是 使 父 进程 先 运行 。 如 果 将 fork 之 后 的 行 改 成 : 


8.10 Mğ exec 199 


else if (pid == 0) { 
charatatime (“output from child\n"); 
TELL PARENT (getppid()); 
) else ( 
WAIT CHILD(); /* child goes first */ 
charatatime (“output from parent\n"); 


} 


则 子 进程 先 运行 。 习 题 8.4 将 继续 这 一 实例 。 
8.10 函数 exec 


8.3 节 曾 提 及 用 fork 函数 创建 新 的 子 进程 后 , 子 进程 往往 要 调用 一 种 exec 函数 以 执行 男 一 
个 程序 。 当 进程 调用 一 种 exec 函数 时 ， 该 进程 执行 的 程序 完全 替换 为 新 程序 ， 而 新 程序 则 从 其 
main 函数 开始 执行 。 因 为 调用 exec 并 不 创建 新 进程 ， 所 以 前 后 的 进程 ID 并 未 改变 。exec 只 
是 用 磁盘 上 的 一 个 新 程序 替换 了 当前 进程 的 正文 段 、 数 据 段 、 堆 段 和 栈 段 。 
有 7 种 不 同 的 exec 函数 可 供 使 用 , 它们 常常 被 统称 为 exec 函数 , 我 们 可 以 使 用 这 7 SAH 
任 一 个 。 这 些 exec 函数 使 得 UNIX 系统 进程 控制 原 语 更 加 完善 。 用 fork 可 以 创建 新 进程 ， 用 exec 
可 以 初始 执行 新 的 程序 。exit 函数 和 wait 函数 处 理 终 止 和 等 待 终 止 。 这 些 是 我 们 需要 的 基本 的 进程 
控制 原 语 。 在 后 面 各 节 中 将 使 用 这 些 原 语 构造 另外 一 些 如 Popen 和 system 之 类 的 函数 。 
#include <unistd.h> 
int execl(const char *pathname, const char *argü, ... /* (char *)0 */ ); 
execv(const char *pathname, char *const argv[]):; 


execle(const char *pathname, const char *argü, . 
/* (char *)0, char *const empl] */ ): 


execve(const char *pathname, char *const argv[], char *const envp[]); 


execlp(const char *filename, const char *argÜ, ... /* (char *)0 */ ); 


execvp(const char *filename, char *const argv[]):; 


fexecve(int fd, char *const argv[], char *const emvpí(]):; 


7 个 函数 返回 值 ， 若 出 错 ， 返 回 -1， 若 成 功 ， 不 返回 


这 些 函 数 之 间 的 第 一 个 区 别 是 前 4 个 函数 取 路 径 名 作为 参数 ， 后 两 个 函数 则 取 文 件 名 作为 参 
数 ， 最 后 一 个 取 文 件 描述 符 作为 参数 。 当 指定 filename 作为 参数 时 : 

。 如果 filename 中 包含 /， 则 就 将 其 视 为 路 径 名 ; 

e 否则 就 按 PATH 环境 变量 ， 在 它 所 指定 的 各 目录 中 搜寻 可 执行 文件 。 

PATH 变量 包含 了 一 张 目 录 表 〈 称 为 路 径 前 绷 )， 目 录 之 间 用 冒号 C) 分 隔 。 例 如 ， 下 列 
name=value 环境 字符 串 指 定 在 4 个 目录 中 进行 搜索 。 


PATH-/bin:/usr/bin:/usr/local/bin:. 


BAQKRRHS .表示 当前 目录 。( 零 长 前 缀 也 表示 当前 目录 。 在 value 的 开始 处 可 用 :表示 ， 

在 行 中 间 则 要 用 : :表示 ， 在 行 尾 以 :表示 。) 
出 于 安全 性 方面 的 考虑 , 有 些 人 要 求 在 搜索 路 径 中 决 不 要 包括 当前 目录 。 请 参见 Garfinkel 等 [2003]。 
如 果 execlp Ek execvp 使 用 路 径 前 绷 中 的 一 个 找到 了 一 个 可 执行 文件 , 但 是 该 文件 不 是 由 
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连接 编辑 器 产生 的 机 器 可 执行 文件 ， 则 就 认为 该 文件 是 一 个 shell 脚本 ， 于 是 试 着 调用 /biny/sh， 
并 以 该 filename 作为 shell 的 输入 。 

fexecve 函数 避免 了 寻找 正确 的 可 执行 文件 ， 而 是 依赖 调用 进程 来 完成 这 项 工作 。 调 用 进程 
可 以 使 用 文件 描述 符 验证 所 需要 的 文件 并 且 无 竞争 地 执行 该 文件 。 否 则 ， 拥 有 特权 的 恶意 用 户 就 
可 以 在 找到 文件 位 置 并 且 验 证 之 后 ， 但 在 调用 进程 执行 该 文件 之 前 替换 可 执行 文件 《或 可 执行 文 
件 的 部 分 路 径 )， 具 体 可 参考 3.3 节 TOCTTOU 的 讨论 。 

第 二 个 区 别 与 参数 表 的 传递 有 关 (1 表示 列表 list. v 表示 矢量 vector). 函数 execl、 execlp 
和 execle 要 求 将 新 程序 的 每 个 命令 行 参数 都 说 明 为 一 个 单独 的 参数 .这 种 参数 表 以 空 指针 结尾 。 
对 于 另外 4 个 函数 (execv、execvp、execve 和 fexecve)， 则 应 先 构 造 一 个 指向 各 参数 的 指 
针 数组 ， 然 后 将 该 数组 地 址 作为 这 4 个 函数 的 参数 。 

在 使 用 ISOC 原型 之 前 , 对 execl、execle 和 execlp 三 个 函数 表示 命令 行 参数 的 一 般 方法 是 : 


char *argÜü, char *argl, ..., char *argn, (char *)0 


这 种 语法 显 式 地 说 明了 最 后 一 个 命令 行 参数 之 后 跟 了 一 个 空 指针 。 如 果 用 常量 0 来 表示 一 个 空 指 
针 ， 则 必须 将 它 强制 转换 为 一 个 指针 ;否则 它 将 被 解释 为 整 型 参数 。 如 果 一 个 整 型 数 的 长 度 与 
char * 的 长 度 不 同 ， 那 么 exec 函数 的 实际 参数 将 出 错 。 

最 后 一 个 区 别 与 向 新 程序 传递 环境 表 相关 。 以 @ 结尾 的 3 个 函数 (execle、execve 和 fexecve) 

可 以 传递 一 个 指向 环境 字符 串 指 针 数 组 的 指针 。 其 他 4 个 函数 则 使 用 调用 进程 中 的 environ 变量 为 新 

程序 复制 现 有 的 环境 (回忆 7.9 节 及 图 7-8 中 对 环境 字符 串 的 讨论 。 其 中 曾 提 及 如 果 系 统 支持 setenv 
Al putenv 这 样 的 函数 , 则 可 更 改 当前 环境 和 后 面 生成 的 子 进程 的 环境 ， 但 不 能 影响 父 进程 的 环境 )。 
通常 ， 一 个 进程 允许 将 其 环境 传播 给 其 子 进程 ， 但 有 时 也 有 这 种 情况 ， 进 程 想 要 为 子 进程 指定 某 一 个 
确定 的 环境 。 例 如 ， 在 初始 化 一 个 新 登录 的 shell Ff, login 程序 通常 创建 一 个 只 定义 少数 几 个 变量 
的 特殊 环境 ， 而 在 我 们 登录 时 ， 可 以 通过 shell 启动 文件 ， 将 其 他 变量 加 到 环境 中 。 

在 使 用 ISO C 原型 之 前 ，execle 的 参数 是 : 

char *pathname, char *arg0, ..., char *argn, (char *)0, char *envp[] 
从 中 可 见 , 最 后 一 个 参数 是 指向 环境 字符 串 的 各 字符 指针 构成 的 数组 的 指针 。 而 在 ISO C 原型 中 ， 
所 有 命令 行 参数 、 空 指针 和 envp 指针 都 用 省 略 号 〈. . . ) 表示 。 

这 7 个 exec 函数 的 参数 很 难 记忆 。 函 数 名 中 的 字符 会 给 我 们 一 些 帮助 。 字 母 p 表示 该 函数 
取 filename 作为 参数 , 并 且 用 PATH 环境 变量 寻找 可 执行 文件 。 字母 1 表示 该 函数 取 一 个 参数 表 ， 
它 与 字母 v HEF. v 表示 该 函数 取 一 个 argv[ RE. R, FY e 表示 该 函数 取 enpi RA, i 
不 使 用 当前 环境 。 图 8-14 显示 了 这 7 个 函数 之 间 的 区 别 。 


m rm [n [^ [ tm m ml 








execl 
execlp 
execle 
execv 
execvp 
execve 
fexecve 


cvyePSEE | d e |t] 3 | v | ft e | 
图 8-14 7 个 exec 函数 之 间 的 区 别 
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每 个 系统 对 参数 表 和 环境 表 的 总 长 度 都 有 一 个 限制 。 在 2.5.2 节 和 图 2-8 中 ， 这 种 限制 是 由 
ARG MAX 给 出 的 。 在 POSIX.1 系统 中 ， 此 值 至 少 是 4096 字 节 。 当 使 用 shell 的 文件 名 扩充 功能 
产生 一 个 文件 名 列表 时 ， 可 能 会 受到 此 值 的 限制 。 例 如 ， 命 令 


grep getrlimit /usr/share/man/*/* 
在 某 些 系统 上 可 能 产生 如 下 形式 的 shell 错误 : 
Argument list too long 


由 于 历史 原因 , System V 中 此 限制 值 是 5 120 FF. FA BSD 系统 的 此 限制 值 是 20 480 FF. 
| 当前 系统 中 ， 此 限制 值 要 大 得 多 。( 如 图 2-14 所 示 的 程序 的 输出 ， 图 2-15 总 结 列 出 了 限制 值 。) 


为 了 摆脱 对 参数 表 长 度 的 跟 制 ,我 们 可 以 使 用 xargs(1) 命 令 , 将 长 参数 表 断 开 成 几 部 分 。 为 
了 寻找 在 我 们 所 用 系统 手册 页 中 的 getrlimit， 我 们 可 以 用 


find /usr/share/man -type f -print | xargs grep getrlimit 
如 果 所 用 的 系统 手册 页 是 压缩 过 的 ， 则 可 使 用 


find /usr/share/man -type f -print | xargs bzgrep getrlimit 


对 于 find 命令 ， 我 们 使 用 选项 -type f， 以 限制 输出 列表 只 包含 普通 文件 。 这 样 做 的 原因 是 ， 
grep 命令 不 能 在 目录 中 进行 模式 搜索 ， 我 们 也 想 避 免 不 必 要 的 出 错 消息 。 
前 面 曾 提 及 ， 在 执行 exec 后 ， 进 程 D 没有 改变 。 但 新 程序 从 调用 进程 继承 了 的 下 列 属性 ; 
e 进程 ID ARE ID 
实际 用 户 ID 和 实际 组 ID 
附属 组 ID 
进程 组 ID 
会 话 ID 
控制 终端 
曾 钟 尚 余 留 的 时 间 
当前 工作 目录 
根 目录 
文件 模式 创建 屏蔽 字 
文件 锁 
进程 信号 屏蔽 
未 处 理 信号 
资源 限制 
nice 值 (遵循 XSI 的 系统 ， 见 8.16 47) 
tms utime、tms_stime、tms_cutime 以 及 tms_cstime 值 
对 打开 文件 的 处 理 与 每 个 描述 符 的 执行 时 关闭 (close-on-exec) 标志 值 有 关 。 IZA 3-7 以 及 
3.14 节 中 对 FD CLOEXEC 标志 的 说 明 , 进程 中 每 个 打开 描述 符 都 有 一 个 热 行 时 关闭 标志 。 若 设置 
了 此 标志 ， 则 在 执行 exec 时 关闭 该 描述 符 ; 否则 该 描述 符 仍 打开 。 除 非特 地 用 fcnt1 设置 了 该 
执行 时 关闭 标志 ， 否 则 系统 的 默认 操作 是 在 exec 后 仍 保持 这 种 描述 符 打 开 。 
POSIX.1 明确 要 求 在 exec 时 关闭 打开 目录 流 ( 见 4.22 节 中 所 述 的 opendir 函数 )。 这 
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通常 是 由 opendir 函数 实现 的 ， 它 调用 fcntl 函数 为 对 应 于 打开 有 目录 流 的 描述 符 设 置 执 
行 时 关闭 标志 。 

注意 ， 在 exec 前 后 实际 用 户 ID 和 实际 组 ID 保持 不 变 ， 而 有 效 ID 是 否 改 变 则 取决 于 所 执行 程 
序 文 件 的 设置 用 户 ID 位 和 设置 组 ID 位 是 否 设置 。 如 果 新 程序 的 设置 用 户 ID 位 已 设置 ， 则 有 效用 户 
ID 变 成 程序 文件 所 有 者 的 ID; 否则 有 效用 户 ID 不 变 。 对 组 ID 的 处 理 方式 与 此 相同 。 

在 很 多 UNIX 实现 中 , 这 7 个 函数 中 只 有 execve 是 内 核 的 系统 调用 。 另外 6 个 只 是 库 函数 ， 
它们 最 终 都 要 调用 该 系统 调用 。 这 7 个 函数 之 间 的 关系 示 于 图 8-15 中 。 









建立 argo 


/proc/self/fd 
alias 


fexecve 


[253] 图 8-15 7 个 exec 函数 之 间 的 关系 


在 这 种 安排 中 ， 库 函数 execlp 和 execvp 使 用 PATH 环境 变量 ， 查 找 第 一 个 包含 名 为 
filename 的 可 执行 文件 的 路 径 名 前 组 。fexecve 库 函 数 使 用 /proec 把 文件 描述 符 参 数 转换 成 路 径 
名 ，execve 用 该 路 径 名 去 执行 程序 。 


这 描述 了 在 FreeBSD 8.0 和 Linux 3.2.0 中 是 如 何 实现 fexecve 的 。 其 他 系统 采用 的 方法 可 能 不 
同 。 例如 , 没有 /proc 和 /dev/fd 的 系统 可 能 把 fexecve 实现 为 系统 调用 ,把 文件 描述 符 参 数 转 
| Ak i 节点 指针 ， 把 execve 实现 为 系统 调用 ， 把 路 径 名 参数 转换 成 让 节点 指针 ， 然 后 把 execve 
| 和 fexecve 中 剩余 的 exec 公共 代码 放 到 单独 的 函数 中 ,调用 该 画 数 时 传 入 执行 文件 的 i 节点 指针 。 


i 


- 3: Di 
图 8-16 中 的 程序 演示 了 exec MR. 


#include "apue.h" 
#include <sys/wait.h> 


char *env_init[] = { "USER-unknown", "PATH-/tmp", NULL }; 


int 
main (void) 
{ 
pid t pid; 


if ((pid = fork()) < O) { 
err sys("fork error"); 
) else if (pid == 0) 1 /* specify pathname, specify environment */ 
if (execle("/home/sar/bin/echoall", "echoall", "myargl", 
"MY ARG2", (char *)0, env init) < 0) 
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err sys("execle error"); 


) 


if (waitpid(pid, NULL, 0) < 0) 
err Sys("wait error"); 


if ((pid = fork()) < 0) { 
err sys ("fork error"); 
) else if (pid == 0) { /* specify filename, inherit environment */ 
if (execlp("echoall", "echoall", "only 1 arg", (char *)0) < 0) 
err sys("execlp error"); 
} 


exit (0}; 


8-16 exec 函数 实例 

在 该 程序 中 先 调用 execle, 它 要 求 一 个 路 径 名 和 一 个 特定 的 环境 .下 一 个 调用 的 是 execlp， 
它 用 一 个 文件 名 ， 并 将 调用 者 的 环境 传送 给 新 程序 。execlp 在 这 里 能 够 工作 是 因为 目录 
/home/sar/bin 是 当前 路 径 前 缀 之 一 。 注 意 ， 我 们 将 第 一 个 参数 (新 程序 中 的 argv[0]) X 
署 为 路 径 名 的 文件 名 分 量 。 某 些 shell 将 此 参数 设置 为 完全 的 路 径 名 。 这 只 是 一 个 惯例 。 我 们 可 将 
argv[0] 设 置 为 任何 字符 串 。 当 login 命令 执行 shell 时 就 是 这 样 做 的 ,在 执行 shell 之 前 , login 
在 argv[0] 之 前 加 一 个 /作为 前 缀 ， 这 向 shell 指明 它 是 作为 登录 shell 被 调用 的 。 登 录 shell 将 执 
行 启动 配置 文件 〈start-up profile) 命令 ， 而 非 登录 shell 则 不 会 执行 这 些 命令 。 

图 8-16 中 的 程序 要 执行 两 次 的 echoall 程序 如 图 8-17 Bia. 这 是 一 个 很 普通 的 程序 ， 它 回 
显 所 有 命令 行 参数 及 全 部 环境 表 。 


#include "apue.h" 


int 
main(int argc, char *argv{]) 
{ 
int i; 
char **potr; 
extern char  **environ; 


for (i = 0; i < argc; itt) /* echo all command-line args */ 
printf("argv[$d]: $sMn", i, argv[i]): 


for (ptr = environ; *ptr != 0; ptr«*)  /* and all env strings */ 
printf("$sWMn", *ptr); 


exit (0); 


图 8-17 间 显 所 有 命令 行 参数 和 所 有 环境 字符 串 
执行 图 8-16 中 的 程序 得 到 ， 


S ./a.out 
argv[0]: echoall 
argv[i]: myargl 
arqv[2]: MY ARG2 
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USER-unknown 
PATH-/tmp 
argv[0]: echoall 
$ argv[1]: only 1 arg 
USER-sar 
LOGNAME-sar 
SHELL-/bin/bash 
还 有 47 行 没有 列 出 
HOME=/home/sar 


YER, shell 提示 符 出 现在 第 二 个 exec 打印 argv[0] 之 前 。 这 是 因为 父 进 程 并 不 等 待 该 子 进程 
结束 。 "i 


8.11 更改 用 户 ID 和 更 改组 ID 


在 UNIX 系统 中 ， 特 权 《〈 如 能 改变 当前 日 期 的 表示 法 ) 以 及 访问 控制 (如 能 否 读 、 写 一 个 特 
定 文 件 )， 是 基于 用 户 ID 和 组 ID 的 。 当 程序 需要 增加 特权 ， 或 需要 访问 当前 并 不 允许 访问 的 资 
源 时 ， 我 们 需要 更 换 自 己 的 用 户 ID 或 组 ID， 使 得 新 ID 具有 合适 的 特权 或 访问 权限 。 与 此 类 似 ， 
当 程 序 需 要 降低 其 特权 或 阻止 对 某 些 资源 的 访问 时 ,也 需要 更 换 用 户 ID RA D, 新 ID 不 具有 相 
应 特权 或 访问 这 些 资源 的 能 力 。 

一 般 而 言 ， 在 设计 应 用 时 ， 我 们 总 是 试图 使 用 最 小 特权 (least privilege) 模型 。 依 照 此 模型 ， 
我 们 的 程序 应 当 只 具有 为 完成 给 定 任务 所 需 的 最 小 特权 。 这 降低 了 由 恶意 用 户 试 图 哄骗 我 们 的 程 
序 以 未 预料 的 方式 使 用 特权 造成 的 安全 性 风险 。 

可 以 用 setuid 函数 设置 实际 用 户 ID 和 有 效用 户 ID. 与 此 类 似 ,可 以 用 setgid 函数 设置 
实际 组 ID 和 有 效 组 ID. 


#include <unistd.h> 


int setuid(uid t uid); 


int setgid(gid t gid); 





关于 谁 能 更 改 ID 有 若干 规则 。 现 在 先 考虑 更 改 用 户 ID 的 规则 《关于 用 户 ID 我 们 所 说 明 的 
一 切 都 适用 于 组 ID )。 

(1) 车 进程 具有 超级 用 户 特 权 ， 则 setuid 函数 将 实际 用 户 ID. ULP ID 以 及 保存 的 设 
置 用 户 ID (saved set-user-ID) 设置 为 vid. 

(2) 若 进程 没有 超级 用 户 特权 , 但 是 uid 等 于 实际 用 户 ID 或 保存 的 设置 用 户 ID, M setuid 
只 将 有 效用 户 ID 设置 为 wid。 不 更 改 实际 用 户 ID 和 保存 的 设置 用 户 ID. 

(3) 如 果 上 面 两 个 条 件 都 不 满足 ， 则 errno 设置 为 EPERM， 并 返回 -1。 

在 此 假定 _POSIX_SAVED_IDS 为 真 。 如 果 没 有 提供 这 种 功能 ， 则 上 面 所 说 的 关于 保存 的 设 
BAP ID 部 分 都 无 效 。 


在 POSIX,1 2001 版 中 ， 保 存 的 ID 是 强制 性 功能 。 而 在 较 早 版 本 中 ， 它 们 是 可 选择 的 。 为 了 
型 清楚 某 种 实现 是 否 支持 这 一 功能 ， 应 用 程序 在 编译 时 可 以 测试 常量 POSIOX SAVED IDS, 或 
”者 在 运行 时 以 SC SAVED IDS 参数 调用 sysconf BK, 
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关于 内 核 所 维护 的 3 个 用 户 DD， 还 要 注意 以 下 几 点 。 
(1) 只 有 超级 用 户 进程 可 以 更 改 实际 用 户 ID.。 通 常 ,实际 用 户 ID 是 在 用 户 登 录 时 ,由 login(l) 
程序 设置 的 ， 而 且 决 不 会 改变 它 。 因 为 login 是 一 个 超级 用 户 进程 ， 当 它 调用 setuid 时 ， 设 
置 所 有 3 个 用 户 ID. 
(2) 仅 当 对 程序 文件 设置 了 设置 用 户 ID 位 时 ，exec 函数 才 设 置 有 效用 户 ID。 如 果 设 置 用 户 ID 
位 没有 设置 ，exec 函数 不 会 改变 有 效用 户 ID， 而 将 维持 其 现 有 值 。 任 何 时 候 都 可 以 调用 setuid， 将 
有 效用 户 ID 设置 为 实际 用 户 ID 或 保存 的 设置 用 户 ID. 自然 地 , 不 能 将 有 效用 户 ID 设置 为 任 一 随机 值 。 
(3) 保存 的 设置 用 户 ID 是 由 exec 复制 有 效用 户 ID 而 得 到 的 。 如 果 设 置 了 文件 的 设置 用 户 ID 位 ， 
则 在 exec 根据 文件 的 用 户 ID 设置 了 进程 的 有 效用 户 ID 以 后 ， 这 个 副本 就 被 保存 起 来 了 。 
8-18 总 结 了 更 改 这 3 个 用 户 ID 的 不 同方 法 。 


Te 
设置 用 户 ID 位 关闭 REAP ID 位 打开 | 超级 用 户 非特 权 用 户 


实际 用 户 ID 不 变 不 变 设 为 uid 
有 效用 户 ID 不 变 设置 为 程序 文件 的 用 户 ID 设 为 uid | WX uid 
保存 的 设置 用 户 ID 从 有 效用 户 ID 复制 | 从 有 效用 户 ID 复制 设 为 uid 
8-18 ”更 改 3 个 用 户 ID 的 不 同方 法 
注意 , 8.2 节 中 所 述 的 getuid 和 geteuid 函数 只 能 获得 实际 用 户 ID 和 有 效用 户 ID 的 当前 
值 。 我 们 没有 可 移植 的 方法 去 获得 保存 的 设置 用 户 ID 的 当前 值 。 
| FreeBSD 8.0 和 LINUX 3.2.0 提供 了 getresuid 和 getresgid 函数 ， 它 们 可 以 分 别 用 于 获 
取保 存 的 设置 用 户 ID 和 保存 的 设置 组 ID。 





1. KM setreuid 和 setregid 
历史 上 ，BSD 支持 setreuid 函数 ， 其 功能 是 交换 实际 用 户 ID 和 有 效用 户 ID 的 值 。 
#include <unistd.h> 


int setreuid(uid t ruid, uid t enid); 


int setregid(gid t rgid, gid t egid); 





如 若 其 中 任 一 参数 的 值 为 -1， 则 表示 相应 的 ID 应 当 保 持 不 变 。 

规则 很 简单 ， 一 个 非特 权 用 户 总 能 交换 实际 用 户 ID 和 有 效用 户 中。 这 就 允许 一 个 设置 用 户 邢 程 
序 交 换 成 用 户 的 普通 权限 ， 以 后 又 可 再 次 交换 回 设置 用 户 ID 权限 。POSIX.1 引进 了 保存 的 设置 用 户 ID 
特性 后 ， 其 规则 也 相应 加 强 ， 它 允许 一 个 非特 权 用 户 将 其 有 效用 户 ID 设置 为 保存 的 设置 用 户 ID. 


seteuid 和 setregid 两 个 函数 都 是 Single UNIX Specification 的 XSI 扩展 。 因 此 ， 可 以 期 

” 望 所 有 UNIX 系统 实现 都 将 对 它们 提供 支持 。 

| 4.3BSD 并 没有 上 面 所 说 的 保存 的 设置 用 户 ID 特性 ,而 是 使 用 set reuid 和 setregid 来 代替 。 

.这 就 万 许 一 个 非特 权 用 户 交 换 这 两 个 用 户 ID 的 值 ， 但 是 要 注意 ， 当 使 用 此 特性 的 程序 生成 shell 进程 

1 时 ， 它 必须 在 exec 之 前 先 将 实际 用 户 ID 设置 为 普通 用 户 ID。 如 果 不 这 样 做 的 话 ， 实 际 用 户 [D 就 可 

| 能 是 具有 特权 的 ( 由 setreuid 的 交换 操作 造成 ) 然后 shell 进程 可 能 会 调用 setreuid 交换 两 个 用 

| P ID 值 并 取得 更 多 权限 。 作 为 一 个 保护 性 的 解决 这 一 问题 的 编程 措施 ， 程 序 在 子 进 程 调 用 exec 

| 之 前 ， 将 子 进程 的 实际 用 户 ID 和 有 效用 户 ID 都 设置 成 普通 用 户 ID。 
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2. BA seteuid 和 setegid 
POIX.1 包含 了 两 个 函数 seteuid 和 setegid。 它们 类 似 于 setuid 和 setgid, 但 只 更 改 
有 效用 户 ID 和 有 效 组 ID. 


#include <unistd.h> 


int seteuid(uid t uid); 


int setegid(gid t gid); 


一 个 非特 权 用 户 可 将 其 有 效用 户 ID 设置 为 其 实际 用 户 ID 8 或 其 保存 的 设置 用 户 ID. 对 于 一 个 
特权 用 户 则 可 将 有 效用 户 ID 设置 为 xig。( 这 区 别 于 setuid 函数 ， 它 更 改 所 有 3 FAP ID.) 
8-19 给 出 了 本 节 所 述 的 更 改 3 个 不 同 用 户 ID 的 各 个 函数 。 


MRAP 超级 用 户 超级 用 户 
setreuid(ruid, euid) setuid(uid) seteuid(uid) 


ruid 
非特 权 的 













非特 权 的 


setreuid 







exec 


设置 用 户 ID 





非特 权 的 非特 权 的 
setuid 或 seteuid setuid K seteuid 


8-19 ”设置 不 同 用 户 ID 的 各 函数 
3. 组 ID 
本 章 中 所 说 明 的 一 切 都 以 类 似 方式 适用 于 各 个 组 DD。 附属 组 ID 不 受 setgid. setregid 
和 setegid 函数 的 影响 。 


和 实例 


为 了 说 明 保存 的 设置 用 户 ID 特性 的 用 法 ， 先 观察 一 个 使 用 该 特性 的 程序 。 我 们 所 观察 的 是 
at(1) 程 序 ， 它 用 于 调度 将 来 某 个 时 刻 要 运行 的 命令 。 
在 Linux 3.2.0 上 安装 的 at 程序 的 设置 用 户 ID 是 daemon 用 户 。 在 FreeBSD 8.0、Mac OS X 
. 10.6.8 以 及 Solaris 10 上 安装 的 at 程序 的 设置 用 户 ID X root AP. LAH at 命令 对 守护 进程 
拥有 的 特权 文件 具有 写 权限 , 守护 进程 代表 用 户 运行 at 命令 。 在 Linux 3.2.0 上 , 程序 是 用 atd(8) 
”守护 进程 运行 的 。 在 FreeBSD 8.0 和 Solaris 10 上 , 程序 通过 cron(1M) 守 护 进 程 运 行 。 在 Mac OS 
| X10.68 上 ， 程 序 通过 1aunchd(8) 守 护 进 程 运行 。 


为 了 防止 被 欺骗 而 运行 不 被 允许 的 命令 或 读 、 写 没有 访问 权限 的 文件 ，at 命令 和 最 终 代 表 


用 户 运行 命令 的 守护 进程 必须 在 两 种 特权 之 间 切 换 : 用 户 特 权 和 守护 进程 特权 。 下 面 列 出 了 其 
工作 步骤 。 
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(1) 程序 文件 是 由 root 用 户 拥有 的 ， 并 且 其 设置 用 户 ID 位 已 设置 。 当 我 们 运行 此 程序 时 ， 
得 到 下 列 结果 : 
实际 用 户 ID= 我 们 的 用 户 ID (RAE) 
有 效用 户 ID=root 
保存 的 设置 用 户 ID=root 
(2) at 程序 做 的 第 一 件 事 就 是 降低 特权 ， 以 用 户 特 权 运 行 。 它 调用 setuid 函数 把 有 效用 
P ID 设置 为 实际 用 户 ID. WNAF: 
实际 用 户 ID= 我 们 的 用 户 ID (RKE) 
有 效用 户 ID= 我 们 的 用 户 ID 
保存 设置 用 户 ID=root (RAF) 

(30 at 程序 以 我 们 的 用 户 特权 运行 ， 直 到 它 需 要 访问 控制 哪些 命令 即将 运行 ， 这 些 命 
令 需 要 何 时 运行 的 配置 文件 时 ，at 程序 的 特权 会 改变 。 这 些 文件 由 为 用 户 运行 命令 的 守护 
进程 持 有 。at 命令 调用 setuid 函数 把 有 效用 户 ID WX root, AW setuid 的 参数 等 于 
保存 的 设置 用 户 ID, 所 以 这 种 调用 是 许可 的 (这 就 是 为 什么 需要 保存 的 设置 用 户 ID 的 原因 )。 
现在 得 到 : 

实际 用 户 DD= 我 们 的 用 户 ID. (RAE) 
有 效用 户 ID=root 
保存 的 设置 用 户 ID-root (RAA) 

因为 有 效用 户 ID 是 root， 文 件 访问 是 允许 的 。 

(4) 修改 文件 从 而 记录 了 将 要 运行 的 命令 以 及 它们 的 运行 时 间 以 后 ，at 命令 通过 调用 seteuid, 
把 有 效用 户 ID 设置 为 用 户 ID， 降 低 它 的 特权 。 防 由 对 特权 的 误 用 。 此 时 我 们 可 以 得 到 ， 

实际 用 户 ID= 我 们 的 用 户 ID (RAE) 
有 效用 户 ID= 我 们 的 用 户 ID 
保存 的 设置 用 户 ID=root (WAE) 

(5) 守护 进程 开始 用 root 特权 运行 ， 代 表 用 户 运行 命令 ， 守 护 进程 调用 fork, Fit 
程 调用 setuid 将 它 的 用 户 ID 更 改 至 我 们 的 用 户 ID。 因 为 子 进 程 以 root 特权 运行 ， 更 改 
了 所 有 的 ID， 所 以 

实际 用 户 ID= 我 们 的 用 户 ID 
有 效用 户 ID= 我 们 的 用 户 ID 
保存 的 设置 用 户 ID= 我 们 的 用 户 ID 

现在 守护 进程 可 以 安全 地 代表 我 们 执行 命令 ， 因 为 它 只 能 访问 我 们 通常 可 以 访问 的 文件 ， 我 
们 没有 额外 的 权限 。 

以 这 种 方式 使 用 保存 的 设置 用 户 ID， 只 有 在 需要 提升 特权 的 时 候 ， 我 们 通过 设置 程序 文件 的 
设置 用 户 ID 而 得 到 的 额外 权限 。 然 而 ， 其 他 时 间 进 程 在 运行 时 只 具有 普通 的 权限 。 如 果 进 程 不 
能 在 其 结束 部 分 切换 回 保 存 的 设置 用 户 ID, 那么 就 不 得 不 在 全 部 运行 时 间 都 保持 额外 的 权限 (这 
可 能 会 造成 麻烦 )。 B“ 


8.12 解释 器 文件 


所 有 现今 的 UNIX 系统 都 支持 解释 器 文件 (interpreter file)。 这 种 文件 是 文本 文件 ， 其 起 始 行 
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的 形式 是 : 
#! pathname [ optional-argument ] 


在 感叹 号 和 pathname 之 间 的 空格 是 可 选 的 。 最 常见 的 解释 器 文件 以 下 列 行 开始 : 


$! /bin/sh 


pathname 通常 是 绝对 路 径 名 ,对 它 不 进行 什么 特殊 的 处 理 ( 不 使 用 PATH 进 行路 径 搜 索 )。 
对 这 种 文件 的 识别 是 由 内 核 作 为 exec 系统 调用 处 理 的 一 部 分 来 完成 的 。 内 核 使 调用 exec 
函数 的 进程 实际 执行 的 并 不 是 该 解释 器 文件 ， 而 是 在 该 解释 器 文件 第 一 行 中 pathname 所 指 
定 的 文件 。 一 定 要 将 解释 器 文件 (文本 文件 ， 它 以 #1! 开头 》 和 解释 器 (由 该 解释 器 文件 第 一 行 
中 的 pathname 指定 ) 区 分 开 来 。 

很 多 系统 对 解释 器 文件 第 一 行 有 长 度 限 制 。 这 包括 #!、pathname、 可 选 参 数 、 终 止 换行 符 以 
及 空格 数 。 


在 FreeBSD 8.0 中 , 该 限制 是 4097 字 节 。Linux 32.0 F, 该 限制 为 128 字 节 。Mac OS X 10.6.8 
中 ， 该 限制 为 513 字 节 ， 而 Solaris 10 的 限制 是 1 024 字 节 。 


B ES 


让 我 们 观察 一 个 实例 ， 从 中 可 了 解 当 被 执行 的 文件 是 个 解释 器 文件 时 ， 内 核 如 何 处 理 exec 
函数 的 参数 及 该 解释 器 文件 第 一 行 的 可 选 参数 .图 8-20 中 的 程序 调用 exec 执行 一 个 解释 器 文件 。 


#include "apue.h" 
#include <sys/wait.h> 


int 
main(void) 
{ 
pid t pid; 


if ((pid = fork()) < 0) { 

err sys ("fork error"); 
} else if (pid == 0) { /* child */ 

if (execl("/home/sar/bin/testinterp", 

"testinterp", "myargl", "MY ARG2", (char *)0) < 0) 
err Sys("execl error"); 

) 
if (waitpid(pid, NULL, 0) < 0) /* parent */ 

err sys("waitpid error"); 
exit (0); 


8-20 ”执行 一 个 解释 器 文件 的 程序 
下 面 先 显示 要 被 执行 的 该 解释 器 文件 的 内 容 〈 只 有 一 行 )， 接 着 是 运行 图 8-20 中 的 程序 得 到 
的 结果 。 


S cat /home/sar/bin/testinterp 
#! /home/sar/bin/echoarg foo 

$ ./a.out 

argv[0]: /home/sar/bin/echoarg 
argv[1]: foo 
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argv[2]: /home/sar/bin/testinterp 
argv[3]: myargl 
argv[4]: MY ARG2 


程序 echoarg (解释 器 ) 回 显 每 一 个 命令 行 参数 ( 它 就 是 图 7-4 中 的 程序 )。 注 意 ， 当 内 核 exec 
解释 器 (/home/sar/bin/echoarg) 时 ，argv[0] 是 该 解释 器 的 pathname, argv([1] ERE 
器 文件 中 的 可 选 参数 ， 其 余 参 数 是 pathname C/home/sar/bin/testinterp) 以 及 图 8-20 
所 示 的 程序 中 调用 execl 的 第 2 个 和 第 3 个 参数 (myargl 和 MY ARG2)。 调 用 execl 时 的 argv[1] 
和 argv[21] 已 在 移 了 两 个 位 置 。 注 意 ， 内 核 取 execl 调用 中 的 pathname 而 非 第 一 个 参数 


(testinterp)， 因 为 一 般 而 言 ，pathname 包含 了 比 第 一 个 参数 更 多 的 信息 。 a" 
实例 


在 解释 器 pathname 后 可 跟随 可 选 参数 。 如 果 一 个 解释 器 程序 支持 -f 选项 ， 那 么 在 pathname 
后 经 常 使 用 的 就 是 -f。 例 如 ， 可 以 以 下 列 方式 执行 awk(1) 程 序 ; 


awk -f myfile 
它 告诉 awk 从 文件 myfile 中 读 awk 程序 。 


Æ UNIX System V 派生 的 很 多 系统 中 ， 常 包含 有 awk 语言 的 两 个 版 本 。awk 常常 被 称 为 “ 老 
i awk", CA5 V7 一 起 分 发 的 原始 版 本 。nawk (Hawk) 包含 了 很 多 增强 功能 ， 对 应 于 在 Aho、 
Kernighan 和 Weinberger[1988] 中 说 明 的 语言 。 此 新 版 本 提供 了 对 命令 行 参 数 的 访问 ， 这 是 下 面 的 
例子 所 需 的 。Solaris 10 提供 了 两 个 版 本 。 
POSIX 1003.2 标准 现在 是 Single UNIX Specification 中 基本 POSIX.1 规范 的 一 部 分 。 在 该 标准 中 , awk f£ 
” 序 是 其 中 的 一 个 实用 程序 。 该 实用 程序 的 基础 也 是 Aho、Kemighan 和 Weinberger[1988] 中 所 描述 的 语言 。 
| Mac OS X 10.6.8 中 的 awk 版 本 基于 贝尔 实验 室 版 本 ， 并 已 将 其 放 在 公共 域 ( public domain ) 
: 中 。FreeBSD 8.0 和 Linux 的 某 些 发 行 版 提供 GNU awk ( gawk )， 它 链接 至 名 字 awk, gawk 版 本 
| 遵循 POSIX 标准 ， 但 也 包括 了 一 些 扩展 。 因 为 gawk 和 贝尔 实验 室 的 awk 版 本 比较 新 ， 所 以 较 之 
: nawk 或 老 版 本 的 awk 更 受 人 欢迎 。( 贝尔 实验 室 的 awk 版 本 可 从 http://cm.bell- 
| labs.com/cm/cs/awkbook/index.html 获取 。) 


在 解释 器 文件 中 使 用 -f 选项 ， 可 以 写成 ; 


#1/bin/awk -f 
《在 此 解释 器 文件 中 后 跟随 awk 程序 ) 


例如 ， 图 8-21 展示 了 在 /usr/local/bin/awkexample 中 的 一 个 解释 器 文件 程序 。 


#!/usr/bin/awk -f 
# Note: on Solaris, use nawk instead 
BEGIN { 
for (i = 0; i < ARGC; i++) 
printf "ARGV[$d] = %s\n", i, ARGV[i] 
exit 





8-21 ”作为 解释 器 文件 的 awk 程序 


如 果 路 径 前 缀 之 一 是 /usr/local/bin， 则 可 以 用 下 列 方式 执行 图 8-21 中 的 程序 (假定 我 
们 已 打开 了 该 文件 的 执行 位 ): 


263 
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$ awkexample filel FILENAME2 £3 
ARGV(Q] = awk 

ARGV[1] = filel 

ARGV[2] = FILENAME2 

ARGV[3] = f3 


执行 /pin/awk 时 ， 其 命令 行 参数 是 ; 

/bin/awk -f /usr/local/bin/awkexample filel FILENAME2 f3 
解释 器 文件 的 路 径 名 (/usr/1local/bin/awkexample) 被 传送 给 解释 器 。 因 为 不 能 期 望 解释 
器 (在 本 例 中 是 /bin/awk) 会 使 用 PATH 变量 定位 该 解释 器 文件 ， 所 以 只 传送 其 路 径 名 中 的 文 
件 名 是 不 够 的 ， 要 将 解释 器 文件 完整 的 路 径 名 传送 给 解释 器 。 当 awk 读 解 释 器 文件 时 ， 因 为 # 是 
awk 的 注释 字符 ， 所 以 它 忽略 第 一 行 。 

可 以 用 下 列 命令 验证 上 述 命令 行 参数 。 

$ fbin/su 成 为 超级 用 户 


Password: 输入 超级 用 户口 令 

# mv /usr/bin/awk /usr/bin/awk.save 保存 原先 的 程序 

# cp /home/sar/bin/echoarg /usr/bin/awk 暂时 替换 它 

# suspend 用 作业 控制 挂 起 超级 用 户 shell 
[1] + Stopped /bin/su 


$ awkexample filel FILENAME2 f3 
argv[0]: /bin/awk 

argv[1]: ~f 

argv[2]: /usr/local/bin/awkexample 
argv[3]: filei 

argv[4]: FILENAME2 


argv[5]: 工 3 

$ fg 用 作业 控制 恢复 超级 用 户 shell 
/bin/su 

# mv /usr/bin/awk.save /usr/bin/awk 恢复 原先 的 程序 

$ exit 终止 超级 用 户 shell 


在 此 例子 中 ， 解 释 器 的 -f 选项 是 必需 的 。 正 如 前 述 ， 它 告诉 awk 在 什么 地 方 找 到 awk 程序 。 如 
果 在 解释 器 文件 中 删除 -E 选项 ， 则 在 试图 运行 该 解释 器 文件 时 , 通常 输出 一 条 出 错 消 息 。 该 出 错 
消息 的 精确 文本 可 能 有 所 不 同 ， 这 取决 于 解释 器 文件 存放 在 何 处 以 及 其 余 参数 是 否 表示 现 有 的 文 
件 等 。 因 为 在 这 种 情况 下 命令 行 参数 是 : 


/bin/awk /usr/local/bin/awkexample filel FILENAME2 f3 

于 是 awk CAK FRE /usr/local/bin/awkexample 解释 为 一 个 awk 程序 。 如 果 
不 能 向 解释 器 传递 至 少 一 个 可 选 参 数 〈 在 本 例 中 是 -f)， 那 么 这 些 解释 器 文件 只 有 对 shell 
才 是 有 用 的 。 s 

是 否 一 定 需要 解释 器 文件 呢 ? 那 也 不 完全 如 此 。 但 是 它们 确实 使 用 户 得 到 效率 方面 的 好 
处 ， 其 代价 是 内 核 的 额外 开销 (因为 识别 解释 器 文件 的 是 内 核 ;。 由 于 下 述 理 由 ,解释 器 文件 
是 有 用 的 。 

CD 有 些 程序 是 用 某 种 语言 写 的 脚本 ， 解 释 器 文件 可 将 这 一 事实 隐藏 起 来 。 例 如 ， 为 了 执行 
图 8-21 程序 ， 只 需 使 用 下 列 命令 行 : 


awkexample opftional-arguments 


而 并 不 需要 知道 该 程序 实际 上 是 一 个 awk 脚本 ， 否 则 就 要 以 下 列 方式 执行 该 程序 ; 
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awk -f awkexample optional-arguments 


(2) 解释 器 脚本 在 效率 方面 也 提供 了 好 处 。 再 考虑 一 下 前 面 的 例子 。 仍 旧 隐 藏 该 程序 是 一 个 
awk 脚本 的 事实 ， 但 是 将 其 放 在 一 个 shell 脚本 中 : 


awk 'BEGIN | 
for (i = 0; i < ARGC; i++) 
printf "ARGV[%d] = %s\n", i, ARGV[i] 

id rie 

这 种 解决 方法 的 问题 是 要 求 做 更 多 的 工作 。 首 先 ，shell 读 此 命令 ， 然 后 试图 execlp 此 文件 
名 。 因 为 shell 脚本 是 一 个 可 执行 文件 ， 但 却 不 是 机 器 可 执行 的 ， 于 是 返回 一 个 错误 ，execlp 就 
认为 该 文件 是 一 个 shell 脚本 〈 它 实际 上 就 是 这 种 文件 )。 然 后 执行 /bin/sh， 并 以 该 shell 脚本 
的 路 径 名 作为 其 参数 。shell 正确 地 执行 我 们 的 shell 脚本 , 但 是 为 了 运行 awk 程序 , 它 调 用 fork、 
exec 和 wait。 于 是 ， 用 一 个 shell 脚本 代替 解释 器 脚本 需要 更 多 的 开销 。 

(3) 解释 器 脚本 使 我 们 可 以 使 用 除 /binysh 以 外 的 其 他 shell 来 编写 shell 脚本 。 当 execlp 
找到 一 个 非 机 器 可 执行 的 可 执行 文件 时 ， 它 总 是 调用 /binyVsh 来 解释 执行 该 文件 。 但 是 ， 用 解释 
器 脚本 则 可 简单 地 写成 : 


$!/bin/csh 
《在 解释 器 文件 中 后 跟随 C shell WA) 


再 一 次 ， 我 们 也 可 将 此 放 在 一 个 /bin/sh 脚本 中 《然后 由 其 调用 C shell)， 但 是 要 有 更 多 的 开销 。 
如 果 3 个 shell 和 awk 没有 用 # 作 为 注释 符 ， 则 上 面 所 说 的 都 无 效 。 


8.13 函数 system 


在 程序 中 执行 一 个 命令 字符 串 很 方便 。 例 如 ， 假 定 要 将 时 间 和 日 期 放 到 某 一 个 文件 中 ， 则 可 
使 用 6.10 节 中 的 函数 实现 这 一 点 。 调 用 time 得 到 当前 日 历时 间 ， 接 着 调用 localtime 将 日 历 
时 间 变 换 为 年 、 月 、 日 、 时 、 分 、 秒 、 周 日 的 分 解 形式 ， 然 后 调用 strftime 对 上 面 的 结果 进行 
格式 化 处 理 ， 最 后 将 结果 写 到 文件 中 。 但 是 用 下 面 的 system 函数 则 更 容易 做 到 这 一 点 : 


system("date > file"); 


ISO C 定义 了 system 函数 ， 但 是 其 操作 对 系统 的 依赖 性 很 强 。POSIX.1 包括 了 system 接 
口 ， 它 扩展 了 ISOC 定义 ， 描 述 了 system 在 POSIX.1 环境 中 的 运行 行为 。 


#include <stdlib.h> 
int system(const char *cmdstring) ; 
WP: (AF) 
如 果 emdstring 是 一 个 空 指针 ， 则 仅 当 命令 处 理 程序 可 用 时 ，system 返回 非 0 值 ， 这 一 特征 
可 以 确定 在 一 个 给 定 的 操作 系统 上 是 否 支持 system 函数 。 在 UNIX 中 ，system 总 是 可 用 的 。 
因为 system 在 其 实现 中 调用 了 fork, exec 和 waitpid, AKA 3 种 返回 值 。 
(D fork 失败 或 者 waitpid KAR EINTR 之 外 的 出 错 ， 则 system 返回 -1， 并 且 设 置 
errno 以 指示 错误 类 型 。 
(2) 如 果 exec 失败 (表示 不 能 执行 shell1)， 则 其 返回 值 如 同 shell 执行 了 exit (127) 
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一 样 。 
(3) 耕 则 所 有 3 个 函数 (fork、exec 和 waitpid) MMI, BA system 的 返回 值 是 shell 
的 终止 状态 ， 其 格式 已 在 waitpid 中 说 明 。 


| eR waitpid 被 一 个 捕 提 到 的 信号 中 断 ， 则 某 些 早期 的 system 实现 都 返回 错误 类 型 值 
| EINTR。 但 是 ， 因 为 没有 可 用 的 策略 能 让 应 用 程序 从 这 种 错误 类 型 中 恢复 ( 子 进程 的 进程 ID 对 调 
| 用 者 来 说 是 未 知 的 )。 POSIX 后 来 增加 了 下 列 要 求 : 在 这 种 情况 下 system 不 返回 一 个 错误 。( 10.5 
节 中 将 讨论 被 中 断 的 系统 调用 。) 


8-22 中 的 程序 是 system 函数 的 一 种 实现 。 它 对 信号 没有 进行 处 理 。10.18 节 中 将 修改 此 
函数 使 其 进行 信号 处 理 。 


#include <sys/wait.h> 
#include <errno.h> 
#include <unistd.h> 


int 
system(const char *cmdstring) /* version without signal handling */ 
{ 

pid_t pid; 

int status; 


if (cmdstring == NULL) 
return (i); /* always a command processor with UNIX */ 


if ((pid = fork()) < 0) { 
status = -1; /* probably out of processes */ 
} else if (pid == 0) { /* child */ 
execl("/bin/sh", "sh", "-c", cmdstring, (char *)0); 
exit (127); /* execl error */ 
) else ( /* parent */ 
while (waitpid(pid, &status, 0) < 0} { 
if (errno != EINTR) { 
status = -1; /* error other than EINTR from waitpid() */ 
break; 


} 


return(status); 


图 8-22 system 函数 (没有 对 信号 进行 处 理 ) 

shell 的 -c 选项 告诉 shell 程序 取 下 一 个 命令 行 参数 (在 这 里 是 cmdstring) 作为 命令 输入 (而 
不 是 从 标准 输入 或 从 一 个 给 定 的 文件 中 读 命 令 )。shell 对 以 null 字 节 终止 的 命令 字符 串 进行 语法 
分 析 ， 将 它们 分 成 命令 行 参 数 。 传 递 给 shell 的 实际 命令 字符 串 可 以 包含 任 一 有 效 的 shell 命令 。 
例如 ， 可 以 用 < 和 > 对 输入 和 输出 重 定向 。 

如 果 不 使 用 shell 执行 此 命令 ， 而 是 试图 由 我 们 自己 去 执行 它 ， 那 将 相当 困难 。 首 先 ， 我 们 必 
须 用 execlp 而 不 是 execl， 像 shell 那样 使 用 PATH 变量 。 我 们 必须 将 null 字 节 终止 的 命令 字 
符 串 分 成 各 个 命令 行 参 数 ， 以 便 调用 execlp。 最 后 ， 我 们 也 不 能 使 用 任何 一 个 shell 元 字符 。 
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注意 ， 我 们 调用 _exit 而 不 是 exit。 这 是 为 了 防止 任 一 标准 IO 缓冲 (这些 缓冲 会 在 fork 
中 由 父 进程 复制 到 子 进 程 ) 在 子 进程 中 被 冲洗 。 
用 图 8-23 中 的 程序 对 这 种 实现 的 system 函数 进行 测试 (pr_exit 函数 定义 在 图 8-5 程序 中 )。 


#include "apue.h" 
#include <sys/wait.h> 


int 
main (void) 
{ 


int status; 


if ((status = system("date")) < 0) 
err sys("system() error"); 


pr_exit (status) ; 


if ((status = system("nosuchcommand")) < 0) 
err sys("system() error"); 


pr_exit (status); 


if ((status = system("who; exit 44")) < 0) 
err sys("system() error"); 


pr exit(status); 


exit (0); 
] 
8-23 ”调用 system 函数 
运行 图 8-23 程序 得 到 : 
$ ./a.out 
Sat Feb 25 19:36:59 EST 2012 
normal termination, exit status = 0 对 于 date 


sh: nosuchcommand: command not found 
normal termination, exit status = 127 对 于 无 此 种 命令 


sar console Jan 1 14:59 
sar ttys000 Feb 7 19:08 
sar ttys001 Jan 15 15:28 
sar ttys002 Jan 15 21:50 
sar ttys003 Jan 21 16:02 


normal termination, exit status - 44 对 于 exit 


使 用 system 而 不 是 直接 使 用 fork 和 exec 的 优点 是 : system 进行 了 所 需 的 各 种 出 错 处 
理 以 及 各 种 信号 处 理 〈 在 10.18 节 中 的 下 一 个 版 本 system 函数 中 )。 

在 UNIX 的 早期 系统 中 ， 包 括 SVR3.2 和 4.3BSD， 都 没有 waitpid 函数 ， 于 是 父 进程 用 下 
列 形式 的 语句 等 待 子 进程 : 


while ((lastpid = wait(&status)) != pid && lastpid != -1) 


. 
+ 


如 果 调 用 system 的 进程 在 调用 它 之 前 已 经 生成 子 进程 ， 那 么 将 引起 问题 。 因 为 上 面 的 
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while 语句 一 直 循 环 执 行 ， 直 到 由 system 产生 的 子 进程 终止 才 停 止 ， 如 果 不 是 用 pid 标识 的 
任 一 子 进程 在 pid 子 进程 之 前 终止 , 则 它们 的 进程 ID 和 终止 状态 都 被 while 语句 丢弃 。 实 际 上 ， 
由 于 wait 不 能 等 待 一 个 指定 的 进程 以 及 其 他 一 些 原因 ，POSIX.1 Rationale EXT waitpid 
函数 。 如 果 不 提 供 waitpid BM, popen 和 pclose 函数 也 会 发 生 同 样 的 问题 A 15.3 4). 
设置 用 户 ID 程序 
如 果 在 一 个 设置 用 户 ID 程序 中 调用 system， 那 会 发 生 什 么 呢 ? 这 是 一 个 安全 性 方面 的 漏 


洞 ， 决 不 应 当 这 样 做 。 图 8-24 程序 是 一 个 简单 程序 ， 它 只 是 对 其 命令 行 参 数 调用 system 函数 。 


#include "apue.h" 


int 
main(int argc, char *argv[]) 
( 


int Status; 


if (argc « 2) 
err quit("command-line argument required"); 


if ((status = system(argv[1])) < O) 
err sys("system() error"); 


pr exit(status); 


exit(0); 


824 Hisystem 执行 命令 行 参数 


将 此 程序 编译 成 可 执行 目标 文件 tsys。 
8-25 所 示 的 是 另 一 个 简单 程序 ， 它 打印 实际 用 户 ID 和 有 效用 户 ID. 


#include "apue.h" 


int 

main (void) 

( 
printf ("real uid = %d, effective uid = $dMn", getuid(), geteuid()); 
exit(0); 


图 8-25 打印 实际 用 户 ID 和 有 效用 户 ID 
将 此 程序 编译 成 可 执行 目标 文件 printuids。 运 行 这 两 个 程序 ， 得 到 如 下 结果 : 


$ tsys printuids 正常 执行 ， 无 特权 
real uid = 205, effective uid = 205 
normal termination, exit status = 0 


$ su 成 为 超级 用 户 
Password: 输入 超级 用 户口 令 

# chown root tsys 更 改 所 有 者 

# chmod u*s tsys 增加 设置 用 户 ID 

# 1s -1 tsys 检验 文件 权限 和 所 有 者 
-rwsrwxr-x 1 root 7888 Feb 25 22:13 tsys 

# exit 退出 超级 用 户 shell 


$ tsys printuids 
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real uid = 205, effective uid = 0 WF! 这 是 一 个 安全 性 漏洞 
normal termination, exit status = 0 


我 们 给 予 tsys 程序 的 超级 用 户 权限 在 system 中 执行 了 fork Hl exec 之 后 仍 被 保持 下 来 。 
|o 有些 实 现 通过 更 改 /bin/sh， 当 有 效用 户 ID 与 实际 用 户 ID 不 匹配 时 ， 将 有 效用 户 ID 设置 
为 实际 用 户 ID ， 这 样 可 以 关闭 上 述 安 全 漏洞 。 在 这 些 系统 中 ， 上 述 示 例 的 结果 就 不 会 发 生 。 不 管 
| 调用 system 的 程序 设置 用 户 ID 位 状态 如 何 ， 都 会 打印 出 相同 的 有 效用 户 ID, 


如 果 一 个 进程 正 以 特殊 的 权限 〈 设 置 用 户 ID 或 设置 组 ID) 运行 ， 它 又 想 生成 另 一 个 进程 执 
行 另 一 个 程序 ， 则 它 应 当 直 接 使 用 fork 和 exec, MHE fork 之 后 、exec 之 前 要 更 改 回 普通 
权限 。 设 置 用 户 ID 或 设置 组 ID 程序 决 不 应 调用 system HR. 
| 这 种 警告 的 一 个 理由 是 :system 调用 shell 对 命令 字符 串 进行 语法 分 析 ， 而 shell 使 用 IFS 
| 变量 作为 其 输入 字段 分 隔 符 。 早 期 的 shell 版 本 在 被 调用 时 不 将 此 变量 重 置 为 普通 字符 集 。 这 就 允 
| 许 一 个 恶意 的 用 户 在 调用 system 之 前 设置 IFS， 造 成 system 执行 一 个 不 同 的 程序 。 


8.14 ”进程 会 计 


KBR UNIX 系统 提供 了 一 个 选项 以 进行 进程 会 计 《〈process accounting) 处 理 。 启 用 该 选项 后 ， 每 
当 进 程 结束 时 内 核 就 写 一 个 会 计 记 录 。 典 型 的 会 计 记 录 包 含 总 量 较 小 的 二 进 制 数据 ， 一 般 包 括 命令 名 、 
所 使 用 的 CPU 时 间 总 量 、 用 户 ID 和 组 DD、 启 动 时 间 等 。 本 节 将 较 详细 地 说 明 这 种 会 计 记 录 ， 这 样 也 
使 我 们 得 到 了 一 个 再 次 观察 进程 的 机 会 ， 以 及 使 用 5.9 节 中 所 介绍 的 fread RAKHE. 
任 一 标准 都 没有 对 进程 会 计 进 行 过 说 明 。 于 是 ， 所 有 实现 都 有 令 人 厌烦 的 差别 。 例 如 ， 关 于 
- VO 的 数量 ，Solaris 10 使 用 的 单位 是 字 节 ，FreeBSD 8.0 和 Mac OS X 10.6.8 使 用 的 单位 是 块 ， 但 
:又 不 考虑 不 同 的 块 长 ， 这 使 得 该 计数 值 并 无 实际 效用 。Linux 3.2.0 则 完全 没有 保持 VO 统计 数 。 
每 种 实现 也 前 有 自己 的 一 套 管理 命令 去 处 理 这 种 原始 的 会 计数 据 。 例 如 ，Solaris 提供 了 
: runacct(lm)f» acctcom(l), FreeBSD 则 提供 sa(8) 命 令 处 理 并 总 结 原始 会 计数 据 。 


一 个 至 今 没 有 说 明 的 函数 (acct) 启用 和 禁用 进程 会 计 。 唯 一 使 用 这 一 函数 的 是 accton(8) 
命令 (这 是 在 几 种 平台 上 都 类 似 的 少数 几 条 命令 中 的 一 条 )。 超 级 用 户 执行 一 个 带路 径 名 参数 的 
accton 命令 启用 会 计 处 理 。 会 计 记录 写 到 指定 的 文件 中 ， 在 FreeBSD 和 Mac OS X 中 ， 该 文件 
通常 是 /var/account/acct; 在 Linux 中 ， 该 文件 是 /var/account/pacct: 在 Solaris 中 ， 
该 文件 是 /var/adm/pacct。 执 行 不 带 任何 参数 的 accton 命令 则 停止 会 计 处 理 。 

会 计 记 录 结 构 定 义 在 头 文件 <sys/acct .h> 中 ， 虽 然 每 种 系统 的 实现 各 不 相同 ， 但 会 计 记 录 
样式 基本 如 下 : 


typedef u short comp t; /* 3-bit base 8 exponent; 13-bit fraction*/ 
struct acct 


{ 


char ac flag; /* flag (see Figure 8.26)*/ 

char ac stat; /* termination status(signal & core flag only)*/ 
/* (Solaris only)*/ 

uid t ac uid; /* real user ID*/ 

gid t ac gid: /* real group ID*/ 

dev t ac tty; /* controlling terminal*/ 

time t ac btime; /* starting calendar time*/ 


comp t ac utime; /* user CPU time*/ 
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comp t ac stime; /* system CPU time*/ 

comp t ac etime; /* elapsed time*/ 

comp t ac mem; /* average memory usage*/ 

comp t ac io; /* bytes transferred (by read and write)*/ 
/* "blocks" on BSD systems*/ 

comp t ac rw; /* blocks read or written*/ 
/* (not present on BSD systems)*/ 

char ac, comm[8]; /* command name: [8] for Solaris, */ 


/* [10] for Mac OS X, [16] for FreeBSD, and*/ 
/* [17] for Linux*/ 
H 
在 大 多 数 的 平台 上 ， 时 间 是 以 时 钟 滴答 数 记 录 的 ， 但 FreeBSD 以 微 秒 进行 记录 的 。 ac_flag 
成 员 记 录 了 进程 执行 期 间 的 某 些 事件 。 这 些 事件 见 图 8-26。 


m ru Linux Mac OS Solaris 
aft e9 3.2.0 X 10.6.8 10 


| AFORK | 进程 是 由 fork 产生 的 ， 但 从 未 调用 exec fork 产生 的 ， 但 从 未 调用 exec 
进程 使 用 超级 用 户 特 权 


进程 转 储 core 
进程 由 一 个 信号 杀 死 
扩展 的 会 计 条 目 

新 记录 格式 





8-26 ”会 计 记 录 中 的 ac_flag fü 

会 计 记 录 所 需 的 各 个 数据 (各 CPU 时 间 、 传 输 的 字符 数 等 ) 都 由 内 核 保存 在 进程 表 中 ， 并 在 
一 个 新 进程 被 创建 时 初始 化 (如 fork 之 后 在 子 进程 中 )。 进 程 终止 时 写 一 个 会 计 记 录 。 这 产生 两 
个 后 果 。 

第 一 ， 我 们 不 能 获取 永远 不 终止 的 进程 的 会 计 记 录 。 像 init 这 样 的 进程 在 系统 生命 周期 中 
一 直 在 运行 ， 并 不 产生 会 计 记 录 。 这 也 同样 适合 于 内 核 守护 进程 ， 它 们 通常 不 会 终止 。 

第 二 ， 在 会 计 文件 中 记录 的 顺序 对 应 于 进程 终 止 的 顺序 ， 而 不 是 它们 启动 的 顺序 。 为 了 确定 
启动 顺序 ， 需 要 读 全 部 会 计 文 件 ， 并 按 启 动 日 历时 间 进 行 排 序 。 这 不 是 一 种 很 完善 的 方法 ， 因 为 
日 历时 间 的 单位 是 秒 ( 见 1.10 节 )， 在 一 个 给 定 的 秒 中 可 能 启动 了 多 个 进程 。 而 墙 上 时 钟 时 间 的 
单位 是 时 钟 滴答 (通常 ， 每 秒 滴答 数 在 60 一 128)。 但 是 我 们 并 不 知道 进程 的 终止 时 间 ， 所 知道 的 
只 是 启动 时 间 和 终止 顺序 。 这 就 意味 着 ， 即 使 墙 上 时 钟 时 间 比 启动 时 间 要 精确 得 多 ， 仍 不 能 按照 
会 计 文 件 中 的 数据 重 构 各 进程 的 精确 启动 顺序 。 

会 计 记 录 对 应 于 进程 而 不 是 程序 。 在 fork 之 后 ， 内 核 为 子 进程 初始 化 一 个 记录 ， 而 不 是 在 
一 个 新 程序 被 执行 时 初始 化 。 昌 然 exec 并 不 创建 一 个 新 的 会 计 记 录 ， 但 相应 记录 中 的 命令 名 改 
AT, AFORK 标志 则 被 清除 。 这 意味 着 ， 如 果 一 个 进程 顺序 执行 了 3 个 程序 (A exec B. B exec 
C， 最 后 是 C exit)， 只 会 写 一 个 会 计 记 录 。 在 该 记录 中 的 命令 名 对 应 于 程序 C， 但 CPU 时 间 是 
程序 A、B 和 C 之 和 。 


"实例 


为 了 得 到 某 些 会 计数 据 以 便 查 看 ， 我 们 按 图 8-27 编写 了 测试 程序 。 
测试 程序 的 源 代码 如 图 8-28 所 示 。 该 程序 调用 4 次 fork。 每 个 子 进程 做 不 同 的 事情 ， 然 后 
终止 。 
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Ton, 第 二 个 子 进程 
^ 
[| sleep(8) NN 第 四 个 子 进程 
exit(0) 
execl 
/bin/dd 


图 8-27 会计 处 理 实例 的 进程 结构 


#include "apue.h" 


int 
main (void) 
{ 
pid_t pid; 


if ((pid = fork()) < 0) 
err sys("fork error"); 





else if (pid != 0) { /* parent */ 
sleep(í(2); 
exit(2); /* terminate with exit status 2 */ 


} 


if ((pid = fork()) « 0) 
err sys("fork error"); 


else if (pid !- 0) ( /* first child */ 
sleep(4); 
abort(); /* terminate with core dump */ 


} 


if ((pid = fork()) < 0} 
err_sys("fork error"); 


else if (pid != 0) { /* second child */ 
execl("/bin/dd", "dd", "if-/etc/passwd", "of-/dev/null", NULL); 
exit (7); /* shouldn't get here */ 


} 


if ((pid = fork()) < 0} 
err sys("fork error"); 


else if (pid != 0) { /* third child */ 
sleep(8); 
exit(0); /* normal exit */ 
) 
sleepí6); /* fourth child */ 
kill(getpid(), SIGKILL);  /* terminate w/signal, no core dump */ 
exit(6); /* shouldn't get here */ 





图 8-28 产生 会 计数 据 的 程序 
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在 Solaris 上 运行 该 测试 程序 ， 然 后 用 图 8-29 中 的 程序 从 会 计 记 录 中 选择 一 些 字段 并 打印 出 来 。 


#include "apue.h" 
#include <sys/acct.h> 


#if defined(BSD) /* different structure in FreeBSD */ 
#define acct acctv2 

#define ac flag ac trailer.ac flag 

#define FMT "&-*.*s e = $.0f, chars = $.0f, $c $c $c $c\n" 
#elif defined(HAS AC STAT) 

#define FMT "$-*.*s e = %6ld, chars = $71d, stat = $3u: $c $c $c %e\n" 
felse 

#define FMT "$&-*.*s e = $61d, chars = %7ld, tc $c $c $cWMn" 
#tendif 

#if defined (LINUX) 

#define acct acct v3 /* different structure in Linux */ 
fendif 


#if !defined(HAS ACORE) 
#define ACORE 0 

fendif 

#if !defined(HAS AXSIG) 
#define AXSIG 0 

fendif 


#if !defined (BSD) 
static unsigned long 
compt2ulong(comp_t comptime) /* convert comp_t to unsigned long */ 


{ 


unsigned long val; 
int exp; 
val = comptime & Oxlfff; /* 13-bit fraction */ 


exp (comptime >> 13) & 7; /* 3-bit exponent (0-7) */ 
while (exp-- > 0) 
val *- 8; 
return(val); 
} 
#endif 


int 
main(int argc, char *argv[]) 
i 
struct acct acdata; 
FILE *fp; 


if (argc !- 2) 
err quit("usage: pracct filename"); 
if ((fp = fopen(argv[1], "r")) == NULL) 
err sys("can't open ts", argv[1]); 
while (fread(&acdata, sizeof(acdata), 1, fp) == 1) { 
printf(FMT, (int)sizeof(acdata.ac comm), 
(int)sizeof(acdata.ac comm), acdata.ac comm, 
#if defined (BSD) 
acdata.ac etime, acdata.ac io, 
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#else 
compt2ulong(acdata.ac etime), compt2ulong(acdata.ac io), 
fendif 
#if defined(HAS AC STAT) 
(unsigned char) acdata.ac stat, 
#endif 
acdata.ac flag & ACORE ? 'D' : ' ', 
acdata.ac flag & AXSIG ? 'X' : ' ', 
acdata.ac flag & AFORK ? 'F' : ' ', 
acdata.ac flag & ASU  ? 'S' : ' '); 
} 
if (ferror(fp)) 
err sys("read error"); 
exit(0); 


8-29 ”打印 从 系统 会 计 文 件 中 选 出 的 字段 
BSD 派生 的 平台 不 支持 ac_stat 成 员 ， 所 以 我 们 在 支持 该 成 员 的 平台 上 定义 了 
HAS AC STAT 和 常量。 基于 特性 而 非 平台 定义 的 符号 常量 使 代码 更 易 读 ， 也 使 我 们 更 容易 修改 程 
序 。 修 改 的 方法 是 对 编译 命令 增加 新 的 定义 。 替 代 方 法 可 以 是 使 用 ， 


#if '!defined(BSD) && !defined(MACOS) 


但 是 ， 当 将 应 用 移植 到 其 他 平台 上 时 ， 这 种 方法 会 带 来 很 大 的 不 便 。 

我 们 定义 了 类 似 的 常量 以 判断 该 平台 是 否 支持 ACORE 和 AxsIG 会 计 标 志 。 我 们 不 能 直接 使 
用 这 两 个 标志 符号 ， 其 原因 是 ， 在 Linux 中 ， 它 们 被 定义 为 enum 类 型 值 ， 而 在 #ifdef RER 
中 不 能 使 用 此 种 类 型 值 。 

为 了 进行 测试 ， 热 行 下 列 操作 步骤 。 

COD 成 为 超级 用 户 ， 用 accton 命令 启用 会 计 处 理 。 注 意 ， 当 此 命令 结束 时 ， 会 计 处 理 已 经 
启用 ， 因 此 在 会 计 文件 中 的 第 一 个 记录 应 来 自 这 一 命令 。 

(2) 终止 超级 用 户 shell, 运行 图 8-28 程序 。 这 会 追加 6 个 记录 到 会 计 文件 中 (超级 用 户 shell 
一 个 、 父 进程 一 个 、4 个 子 进程 各 一 个 )。 

在 第 二 个 子 进程 中 ，execl 并 不 创建 一 个 新 进程 ， 所 以 对 第 二 个 进程 只 有 一 个 会 计 记 录 。 

(3) 成 为 超级 用 户 ， 停 止 会 计 处 理 。 因 为 在 accton 命令 终止 时 已 经 停止 会 计 处 理 ， 所 以 不 
会 在 会 计 文件 中 增加 一 个 记录 。 

(4) 运行 图 8-29 程序 ， 从 会 计 文件 中 选 出 字段 并 打印 。 

第 4 步 的 输出 如 下 面 所 示 。 在 每 一 行 中 都 对 进程 追加 了 说 明 ， 以 便 后 面 讨论 。 


accton e = 1, chars = 336, stat = 0: S 

sh e = 1550, chars = 20168, stat = 0: S 

dd e= 2, chars = 1585, stat = 0 第 二 个 子 进 程 
a.out e= 202, chars = 0, stat = 0 父 进程 
a.out e- 420, chars = 0, stat = 134: F 第 一 个 子 进程 
a.out e = 600, chars = 0, stat = 9: F 第 四 个 子 进程 
a.out e = 801, chars = 0, stat = 0: F 第 三 个 子 进程 


墙 上 时 钟 时 间 值 的 单位 是 每 秒 滴答 数 。 从 图 2-15 中 可 见 ， 本 系统 的 每 秒 滴答 数 是 100。 例如 ， 
在 父 进程 中 的 sleep(2) 对 应 于 墙 上 时 钟 时 间 202 个 时 钟 滴答 。 对 于 第 一 个 子 进程 ，sleep(4) 变 
成 420 时 钟 滴答 。 注 意 ， 一 个 进程 休眠 的 时 间 总 量 并 不 精确 。( 第 10 章 将 返回 到 sleep BR.) 
调用 fork 和 exit 也 需要 一 些 时 间 。 
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注意 , ac_stat 成 员 并 不 是 进程 的 真正 终止 状态 。 它 只 是 8.6 节 中 讨论 的 终止 状态 的 一 部 分 。 
如 果 进 程 异 常 终止 ， 则 此 字 节 包 含 的 信息 只 是 core 标志 位 〈 一 般 是 最 高 位 ) 以 及 信号 编号 数 〈 一 

般 是 低 7 位 )。 如 果 进 程 正常 终止 ， 则 从 会 计 文 件 不 能 得 到 进程 的 退出 〈exit ) 状态 。 对 于 第 一 
个 子 进程 , 此 值 是 128+6。 128 是 core 标志 位 , 6 是 此 系统 信号 SIGABRT 的 值 ( 它 是 由 调用 abort 
产生 的 )。 第 四 个 子 进程 的 值 是 9， 它 对 应 于 SIGKILL 的 值 。 从 会 计 文件 的 数据 中 不 能 分 辨 出 ， 
父 进程 在 退出 时 所 用 的 参数 值 是 2， 第 三 个 子 进程 退出 时 所 用 的 参数 值 是 0。 

dd 进程 将 文件 /etc/passwd 复制 到 第 二 个 子 进程 中 ， 该 文件 的 长 度 是 777 字 节 。 而 VO F 
符 数 是 此 值 的 2 倍 ， 其 原因 是 读 了 777 字 节 ， 然 后 又 写 了 777 字 节 。 即 使 输出 到 空 设 备 ， 但 仍 对 
VO 字符 数 进行 计算 。dd 命令 还 有 31 个 附加 字 节 ， 用 于 报告 读 写字 节 数 的 摘要 信息 ， 该 摘要 信 
息 也 会 在 stdout 上 打印 输出 。 

ac flag 值 与 我 们 所 预料 的 相同 。 除 调用 execl 的 第 二 个 子 进程 以 外 ， 其 他 子 进 程 都 设置 
I P 标志 。 父 进程 没有 设置 F 标志 ， 其 原因 是 执行 父 进程 的 交互 式 shell 调用 fork， 然 后 执行 
a.out 文件 。 第 一 个 子 进程 调用 abort. abort 产生 信号 SIGABRT, 产生 了 core 转 储 。 该 进程 
AY x 标志 和 D 标志 都 没有 打开 ， 因 为 Solaris 不 支持 它们 ; 相关 信息 可 从 ac stat 字段 导出 。 第 
四 个 子 进 程 也 因 信 和 号 而 终止 ， 但 是 SIGKILL 信和 号 并 不 产生 core 转 储 ， 它 只 是 终止 该 进程 。 

最 后 要 说 明 的 是 : 第 一 个 子 进程 的 VO 字符 数 为 0， 但 是 该 进程 产生 了 一 个 core 文件 。 其 
原因 是 写 core 文件 所 需 的 IO 并 不 由 该 进程 负责 。 E’ 
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任 一 进程 都 可 以 得 到 其 实际 用 户 ID 和 有 效用 户 ID 及 组 ID. 但 是 , 我 们 有 了 时 希望 找到 运行 该 
程序 用 户 的 登录 名 。 我 们 可 以 调用 getpwuid(getuid 0). 但 是 如 果 一 个 用 户 有 多 个 登录 名 ， 
这 些 登 录 名 又 对 应 着 同一 个 用 户 DD， 又 将 如 何 呢 ?“ 一 个 人 在 口令 文件 中 可 以 有 多 个 登录 项 ， 它 
们 的 用 户 ID 相同 ， 但 登录 shell 不 同 。〉 系 统 通 常 记 录用 户 登 录 时 使 用 的 名 字 CIL 6.8 节 )， 用 
getlogin 还 数 可 以 获取 此 登录 名 。 





如 果 调 用 此 函数 的 进程 没有 连接 到 用 户 登录 时 所 用 的 终端 ， 则 函数 会 失败 。 通 常 称 这 些 进程 
[275] 为 守护 进程 (daemon), 4 13 章 将 对 这 种 进程 专门 进行 讨论 。 
给 出 了 登录 名 , 就 可 用 getpwnam 在 口令 文件 中 查找 用 户 的 相应 记录 , 从 而 确定 其 登录 shell 等 。 
为 了 找到 登录 名 ，UNIX 系统 在 历史 上 一 直 是 调用 ttyname 函数 ( 见 18.9 节 ), KEE utmp 
文件 ( 见 6.8 节 ) 中 找 匹配 项 。FreeBSD 和 Mac OS X 将 登录 名 存放 在 与 进程 表 项 相关 联 的 会 话 外 
构 中 ， 并 提供 系统 调用 获取 该 登录 名 。 
System V 提供 cuserid 函数 返回 登录 名 。 此 函数 先 调 用 getlogin 函数 ， 如 果 失 败 则 再 调 
| 用 getpwuid(getuid() )。IEEE 标准 1003.1-1988 说 明了 cusezrid， 但 是 它 以 有 效用 户 ID 而 
; 不 是 实际 用 户 ID 来 调用 。POSIX.1 的 1990 版 本 删除 了 cuserid BH, 
1 环境 变量 LOGNAME 通常 由 1ogin(]) 以 用 户 的 登录 名 对 其 赋 初 值 , 并 由 登录 shell 继承 。 但 是 ， 
用 户 可 以 修改 环境 变量 ， 所 以 不 能 使 用 LOGNAME 来 验证 用 户 ， 而 应 当 使 用 getlogin BK, 
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UNIX 系统 历史 上 对 进程 提供 的 只 是 基于 调度 优先 级 的 粗 粒 度 的 控制 。 调 度 策略 和 调度 优先 
级 是 由 内 核 确定 的 。 进程 可 以 通过 调整 nice 值 选择 以 更 低 优先 级 运行 (通过 调整 nice 值 降低 它 对 
CPU 的 占有 ， 因 此 该 进程 是 “友好 的 ”)。 只 有 特权 进程 允许 提高 调度 权限 。 

POSIX 实时 扩展 增加 了 在 多 个 调度 类 别 中 选择 的 接口 以 进一步 细 调 行为 。 我 们 这 里 只 讨论 用 
于 调整 nice 值 的 接口 ， 这 些 包 括 在 POSIX.1 的 XSI 扩展 选项 中 。 关 于 实时 调度 扩展 更 多 的 信息 ， 
可 参考 Gallmeister[1995]。 

Single UNIX Specification 中 nice 值 的 范围 在 0~ (2*NZERO) -1 之 间 ， 有 些 实现 支持 O~ 
2*NZERO. nice 值 越 小 ， 优 先 级 越 高。 虽然 这 看 起 来 有 点 倒退 ， 但 实际 上 是 有 道理 的 ， 你 越 友好 ， 
你 的 调度 优先 级 就 越 低 。NZERO 是 系统 默认 的 nice t. 

| 注意 ， 定 义 NZERO 的 头 文件 因 系 统 而 异 。 除 了 头 文件 以 外 ，Linux 3.2.0 可 以 通过 非 标准 的 
| sysconf 参数 (_SC_NZERO) 来 访问 NZERO 的 值 。 

进程 可 以 通过 nice 函数 获取 或 更 改 它 的 nice 值 。 使 用 这 个 函数 ， 进 程 只 能 影响 自己 的 nice 
值 ， 不 能 影响 任何 其 他 进程 的 nice 值 。 


#include <unistd.h> 


int nice(int incr}; 





返回 值 ， 着 成 功 ， 返 回 新 的 nice 值 NzERO， 若 出 错 ， 返 回 -1 
incr 参数 被 增加 到 调用 进程 的 mice 值 上 。 如 果 inr 太 大 ， 系 统 直接 把 它 降 到 最 大 合法 值 ， 不 给 出 
提示 。 类 似 地 ， 如 果 inr 太 小 ， 系 统 也 会 无 声息 地 把 它 提 高 到 最 小 合法 值 。 由 于 -1 是 合法 的 成 功 返 回 
值 ， 在 调用 nice 函数 之 前 需要 清楚 errno， 在 nice 函数 返回 -1 时 ， 需 要 检查 它 的 值 。 如 果 nice 
调用 成 功 ， 并 且 返 回 值 为 -1， 那 么 errno 仍然 为 0。 如 果 errno 不 为 0， 说 明 nice WHAM. 
getpriority RAT LUA nice 函数 那样 用 于 获取 进程 的 nice 值 ， 但 是 getpriority 还 
可 以 获取 一 组 相关 进程 的 nice 值 。 


#include <sys/resource.h> 
int getpriority(int which, id t who); 
返回 值 : 若 成 功 ， 返 回 -NZERO~NZERO-1 之 间 的 nice fH; HUH. 3RIBI-1 


which 参数 可 以 取 以 下 三 个 值 之 一 : PRIO_PROCESS 表示 进程 ，PRIO_PGRP 表示 进程 组 ， 
PRIO USER 表示 用 户 ID. which 参数 控制 who 参数 是 如 何 解释 的 ，wpo 参数 选择 感 兴趣 的 一 个 
或 多 个 进程 。 如 果 who 参数 为 0， 表 示 调 用 进程 、 进 程 组 或 者 用 户 〈 取 决 于 which 参数 的 值 )。 当 
which 设 为 PRIO_USER 并 且 who 为 0 时， 使 用 调用 进程 的 实际 用 户 ID。 如 果 which 参数 作用 于 
多 个 进程 ， 则 返回 所 有 作用 进程 中 优先 级 最 高 的 《最 小 的 nice 值 )。 

setpriority 函数 可 用 于 为 进程 、 进 程 组 和 属于 特定 用 户 ID 的 所 有 进程 设置 优先 级 。 


#include <sys/resource.h> 





int setpriority(int which, id t who, int value); 





BR which 和 who Ej getpriority 函数 中 相同 。valwe 增加 到 NZERO E, 然后 变 为 新 的 nice 值 。 
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| nice 系统 调用 起 源 于 早期 Research. UNIX 系统 的 PDP-11 MA. getpriority 和 
| setpriority 函数 源 于 4.2BSD。 


Single UNIX Specification 没有 对 在 fork 之 后 子 进程 是 否 继承 nice 值 制 定 规则 ， 而 是 留 给 具 
体 实现 自行 决定 。 但 是 遵循 XSI 的 系统 要 求 进程 调用 exec 后 保留 nice 值 。 


Æ FreeBSD 8.0、Linux 3.2.0. MacOS X 10.6.8 以 及 Solaris 10 中 ， 子 进程 从 父 进程 中 继承 
nice 值 。 


^u 实例 


8-30 的 程序 度量 了 调整 进程 nice 值 的 效果 。 两 个 进程 并 行 运行 ， 各 自 增加 自己 的 计数 器 。 
父 进程 使 用 了 默认 的 nice 值 ， 子 进程 以 可 选 命令 参数 指定 的 调整 后 的 nice 值 运行 。 运 行 10 s 后 ， 
两 个 进程 都 打印 各 自 的 计数 值 并 终止 。 通 过 比较 不 同 nice 值 的 进程 的 计数 值 的 差异 ， 我 们 可 以 了 
解 nice 值 时 如 何 影响 进程 调度 的 。 


#include "apue.h" 
#include <errno.h> 
#include <sys/time.h> 


#if defined (MACOS) 
finclude <sys/syslimits.h> 
#elif defined (SOLARIS) 
#include <limits.h> 

#elif defined (BSD) 
#include <sys/param.h> 
#tendif 


unsigned long long count; 
struct timeval end; 


void 
checktime (char *str) 
{ 


struct timeval tv; 


gettimeofday(&tv, NULL); 

if (tv.tv sec >= end.tv sec && tv.tv_usec >= end.tv_usec) 
printf("%s count = %lld\n", str, count); 
exit (0); 


一 一 


} 


int 
main(int argc, char *argví]) 
( 

pidt pid; 


char *s; 
int nzero, ret; 
int adj = 0; 


setbuf (stdout, NULL); 
#if defined (NZERO} 
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nzero = NZERO; 
#elif defined( SC NZERO) 
nzero - sysconf( SC NZERO); 
#else 
#error NZERO undefined 
#endif 
printf("NZERO = %d\n", nzero); 
if (argc == 2) 
adj = strtol(argv[1], NULL, 10); 
gettimeofday(&end, NULL); 
end.tv_sec += 10; /* run for 10 seconds */ 


if ((pid = fork()) < 0) ( 
err_sys ("fork failed"); 
} else if (pid == 0) { /* child */ 
s = "child"; 
printf ("current nice value in child is $d, adjusting by %d\n", 
nice(0)+nzero, adj); 
errno = 0; 
if ((ret = nice(adj)) == -1 && errno != 0) 
err_sys ("child set scheduling priority"); 
printf("now child nice value is $dMn", ret+nzero}; 
) else { /* parent */ 
S = "parent"; 
printf("current nice value in parent is %d\n", nice(0)+nzero); 
} 
for(;;) { 
if {++count == 0} 
err quit("$s counter wrap", s); 
checktime (8); 


图 8-30 EM nice 值 的 效果 


执行 该 程序 两 次 :一 次 用 默认 的 nice 值 ， 另 一 次 用 最 高 有 效 nice 值 〈 最 低调 度 优先 级 )。 程 
序 运行 在 单 处 理 器 Linux 系统 上 ， 以 显示 调度 程序 如 何在 不 同 nice 值 的 进程 间 进 行 CPU 的 共享 。 
否则 ,， 对 于 有 空闲 资源 的 系统 ,如 多 处 理 回 系统 (或 多 核 CPU), 两 个 进程 可 能 无 需 共享 CPU( 运 
行 在 不 同 的 处 理 器 上 )， 就 无 法 看 出 具有 不 同 nice 值 的 两 个 进程 的 差异 。 


$ ./a.out 

NZERO - 20 

current nice value in parent is 20 

current nice value in child is 20, adjusting by 0 
now child nice value is 20 

child count = 1859362 

parent count - 1845338 

$ ./a.out 20 

NZERO - 20 

current nice value in parent is 20 

current nice value in child is 20, adjusting by 20 
now child nice value is 39 

parent count - 3595709 

child count - 52111 


当 两 个 进程 的 nice 值 相 同时 ， 父 进程 占用 50.2948] CPU， 子 进程 占用 49.8% 的 CPU。 可 以 看 
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到 ， 两 个 进程 被 有 效 地 进行 了 平等 对 待 。 百 分 比 并 不 完全 相同 ， 是 因为 进程 亩 度 并 不 精确 ， 而 且 

子 进 程 和 父 进程 在 计算 结束 时 间 和 处 理 循 环 开 始 时 间 之 间 执 行 了 不 同 数量 的 处 理 。 
相 比 之 下 , 当 子 进程 有 最 高 可 能 nice 值 ( 最 低 优先 级 ) 时 , 我 们 看 到 父 进程 占用 98.5% 的 CPU, 
而 子 进程 只 占用 1.5% 的 CPU。 这 些 值 取决 于 进程 调度 程序 如 何 使 用 nice 值 ， 因 此 不 同 的 UNIX 
系统 会 产生 不 同 的 CPU 占用 比 。 " 


8.17 ”进程 时 间 


在 1.10 节 中 说 明了 我 们 可 以 度量 的 3 个 时 间 : 墙 上 时 钟 时 间 、 用 户 CPU 时 间 和 系统 CPU 时 
间 。 任 一 进程 都 可 调用 times 函数 获得 它 自己 以 及 已 终止 子 进程 的 上 述 值 。 


#include <sys/times.h> 


clock t times(struct tms *buf)); 
返回 值 ， 若 成 功 ， 返 回流 逝 的 墙 上 时 锦 时 间 《 以 时 钟 滴答 数 为 单位 )， 着 出错 ， 返 回 -1 


此 函数 填写 由 buf 指 向 的 tms 结构 ， 该 结构 定义 如 下 : 





struct tms { 
Clock t tms utime; /* user CPU time */ 
clock t tms stime; /* system CPU time */ 
clock t tms, cutime; /* user CPU time,terminated children */ 
clock t tms, cstime; /* system CPU time,terminated children */ 
un 


注意 ， 此 结构 没有 包含 墙 上 时 钟 时 间 。times 函数 返回 墙 上 时 钟 时 间作 为 其 函数 值 。 此 值 是 
相对 于 过 去 的 某 一 时 刻度 量 的 ， 所 以 不 能 用 其 绝对 值 而 必须 使 用 其 相对 值 。 例 如 ， 调 用 times, 
保存 其 返回 值 。 在 以 后 某 个 时 间 再 次 调用 times， 从 新 返回 的 值 中 减 去 以 前 返回 的 值 ， 此 差 值 就 
是 墙 上 时 钟 时 间 。( 一 个 长 期 运行 的 进程 可 能 其 墙 上 时 钟 时 间 会 溢出 ， 当 然 这 种 可 能 性 极 小 ， 见 
习题 1.5)。 

该 结构 中 两 个 针对 子 进程 的 字段 包含 了 此 进程 用 本 章 开始 部 分 的 wait 函数 族 已 等 待 到 的 各 
子 进程 的 值 。 

所 有 由 此 函数 返回 的 clock t 值 都 用 _SC_CLK_TCK (Hi sysconf 函数 返回 的 每 秒 时 钟 滴 
答 数 ， 见 2.5.4 节 ) 转换 成 秒 数 。 

| 大 多 数 实现 提供 了 getrusage(2)HH, 该 函数 返回 CPU 时 间 以 及 指示 资源 使 用 情况 的 另外 
| 14 个 值 。 它 起 源 于 BSD 系统 ， 所 以 BSD 派生 的 实现 与 其 他 实现 比较 ， 支 持 的 字段 要 多 一 些 。 


实例 
图 8-31 中 的 程序 将 每 个 命令 行 参数 作为 shell 命令 串 执行 ， 对 每 个 命令 计时 ， 并 打印 从 tms 
结构 取得 的 值 。 


#include "apue.h" 
#include <sys/times.h> 


static void pr_times(clock_t, struct tms *, struct tms *); 
static void do_cmd(char *); 


int 


main(int argc, char *argv[]) 


{ 


int 


i; 


setbuf (stdout, NULL); 
1; i < argc; i++) 


for (i = 


do, cmd (argv[i]); 


exit(0); 


static void 
do cmd(char *cmd) 


{ 


struct tms 


clock_t 
int 


/* execute and time the "cmd" */ 


tmsstart, tmsend; 


start, end; 
status; 


/* once for each command-line arg */ 


printf ("\ncommand: %s\n", cmd); 


if ((start = times(&tmsstart)) == -1)  /* starting values */ 


err sys("times error"); 


if ((status = system(cmd)) < 0) 


err sys("system() error"); 


if ((end = times(&tmsend)) -- -1) /* ending values */ 
err sys("times error"); 


pr times(end-start, &tmsstart, &tmsend); 


pr_exit (status) ; 


Static void 
pr times(clock t real, struct tms *tmsstart, struct tms *tmsend) 


{ 


Static long clktck = 0; 


if (clktck == 0) /* fetch clock ticks per second first time */ 


if ((clktck = sysconf( SC ,CLK TCK)) < 0) 
err Sys("sysconf error"); 


printf(" real: %7.2£\n", real / (double) clktck); 
printf(" user: %7.2f£\n", 


(tmsend-»tms utime - tmsstart-»tms utime) / (double) clktck); 


printf(" sys: %7.2£\n", 


(tmsend-»tms stime - tmsstart-»tms stime) / (double) clktck); 


printf(" child user: 
(tmsend-»tms cutime 

printf(" child sys: 
(tmsend-»tms cstime 


运行 此 程序 可 以 得 到 : 


$7.2fMn", 


—- tmsstart-»tms cutime) / (double) clktck); 


$7.2£Mn", 


- tmsstart-»tms cstime) / (double) clktck); 


8-31 计时 并 执行 所 有 命令 行 参数 


/* execute command */ 
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$ ./a.out "sleep 5" "date" "man bash »/dev/null" 
command: sleep 5 

real: 5.01 

user: 0.00 

Sys: 0.00 

child user: 0.00 

child sys: 0.00 
normal termination, exit status = 0 


command: date 
Sun Feb 26 18:39:23 EST 2012 
real: 0.00 
user: 0.00 
sys: 0.00 
child user: 0.00 
child sys: 0.00 
normal termination, exit status = 0 


command: man bash >/dev/null 
real: 1.46 
user: 0.00 
sys: 0.00 
child user: 1.32 
child sys: 0.07 
normal termination, exit status = 0 


在 前 两 个 命令 中 , 命令 执行 时 间 足 够 快 避免 了 以 可 报告 的 精度 记录 CPU 时 间 。 但 在 第 3 个 命 
令 中 ， 运 行 了 一 个 处 理 时 间 足 够 长 的 命令 来 表明 所 有 的 CPU 时 间 都 出 现在 子 进程 中 ， 而 shell 和 
命令 正 是 在 子 进程 中 执行 的 。 a 


8.18 小结 


对 在 UNIX 环境 中 的 高 级 编程 而 言 ， 完 整地 了 解 UNIX 的 进程 控制 是 非常 重要 的 。 其 中 必须 
熟练 掌握 的 只 有 几 个 函数 一 一 fork、exec 系列 、 exit. wait 和 waitpid。 很 多 应 用 程序 都 
使 用 这 些 简单 的 函数 。fork 函数 也 给 了 我 们 一 个 了 解 竞争 条 件 的 机 会 。 

282 本 章 说 明了 system 函数 和 进程 会 计 ， 这 也 使 我 们 能 进一步 了 解 所 有 这 些 进程 控制 函数 。 本 

章 还 说 明了 exec 函数 的 另 一 种 变 体 : 解释 器 文件 及 它们 的 工作 方式 。 对 各 种 不 同 的 用 户 ID 和 组 
ID 实际 、 有 效 和 保存 的 ) 的 理解 ， 对 编写 安全 的 设置 用 户 ID 程序 是 至 关 重 要 的 。 

在 了 解 进程 和 子 进程 的 基础 上 ， 下 一 章 将 进一步 说 明 进 程 和 其 他 进程 的 关系 一 一 会 话 和 作业 
控制 。 第 10 章 将 说 明 信 号 机 制 并 以 此 结束 对 进程 的 讨论 。 


习题 
8.1 在 图 8-3 程 序 中 ,如 果 用 exit 调用 代替 _exit 调用 ,那么 可 能 会 使 标准 输出 关闭 ,使 printf 


返回 -1。 修 改 该 程序 以 验证 在 你 所 使 用 的 系统 上 是 否 会 产生 此 种 结果 。 如 果 并 非 如 此 ， 你 怎 
样 处 理 才 能 得 到 类 似 结果 呢 ? 


8.2 


8.3 


8.4 


8.5 


8.6 
8.7 
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回忆 图 7-6 中 典型 的 存储 空间 布局 。 由 于 对 应 于 每 个 函数 调用 的 栈 帧 通常 存储 在 栈 中 ， 并 且 
由 于 调用 vfork 后 ， 子 进程 运行 在 父 进程 的 地 址 空间 中 ， 如 果 不 是 在 main 函数 中 而 是 在 
另 一 个 函数 中 调用 vfork, 此 后 子 进 程 又 从 该 函数 返回 , 将 会 发 生 什么 ? 请 编写 一 段 测试 程 
序 对 此 进行 验证 ， 并 且 画 图 说 明 发 生 了 什么 。 

BSA 8-6 中 的 程序 ， 把 wait 换 成 waitid。 不 调用 pr_ exit, 而 从 siginfo 结构 中 确 
定 等 价 的 信息 。 

当 用 $. /a.out 执行 图 8-13 中 的 程序 一 次 时 ， 其 输出 是 正确 的 。 但 是 车 将 该 程序 按 下 列 方 
式 执行 多 次 ， 则 其 输出 不 正确 。 

$ ./a.out ; a.out ;./a.out 

output from parent 

ooutput from parent 

ouotuptut from child 

put from parent 


output from child 
utput from child 


原因 是 什么 ? 怎样 才能 更 正 此 类 错误 ? 如 果 使 子 进程 首先 输出 ， 还 会 发 生 此 问题 吗 ? 

在 图 8-20 所 示 的 程序 中 ， 调 用 exec1， 指 定 pathname 为 解释 器 文件 。 如 果 将 其 改 为 调用 
execlp, {Æ testinterp 的 .jenarme， 并 且 如 果 目 录 /home/sar/bin 是 路 径 前 级 ， 则 
运行 该 程序 时 ，argv[2] 的 打印 输出 是 什么 ? 

编写 一 段 程序 创 建 一 个 仅 死 进程 ， 然 后 调用 system 执行 ps(1) 命 令 以 验证 该 进程 是 伪 死 进程 。 
8.10 THEE POSIX.1 要 求 在 exec 时 关闭 打开 目录 流 。 按 下 列 方法 对 此 进行 验证 : 对 根 目 
录 调 用 opendir， 查 看 在 你 系统 上 实现 的 DIR 结构 ， 然 后 打印 执行 时 关闭 标志 。 接 着 打开 
同一 目录 读 并 打印 执行 时 关闭 标志 。 
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9.1 引言 


在 上 一 章 我 们 已 了 解 到 进程 之 间 具 有 关系 。 首 先 ， 每 个 进程 有 一 个 父 进程 〈 初 始 的 内 核 级 进 
程 通常 是 自己 的 父 进 程 )。 当 子 进程 终止 时 ， 父 进程 得 到 通知 并 能 取得 子 进 程 的 退出 状态 。 在 8.6 
节 说 明 waitpid 函数 时 ， 我 们 也 提 到 了 进程 组 ， 以 及 如 何等 待 进程 组 中 的 任意 一 个 进程 终止 。 

本 章 将 更 详细 地 说 明 进 程 组 以 及 POSIX.1 引入 的 会 话 的 概念 。 还 将 介绍 登录 shell (登录 时 所 
调用 的 ) 和 所 有 从 登录 shell 启动 的 进程 之 间 的 关系 。 

在 说 明 这 些 关系 时 不 可 能 不 谈 及 信号 ， 而 讨论 信号 时 又 需要 很 多 本 章 介 绍 的 概念 。 如 果 你 不 
熟悉 UNIX 系统 信号 机 制 ， 则 可 能 先 要 浏览 一 下 第 10 章 。 


9.2 终端 登录 


先 说 明 当 我 们 登录 到 UNIX 系统 时 所 执行 的 各 个 程序 。 在 早期 的 UNIX 系统 (如 V7》 中， 用户 用 
哑 终 端 《 用 硬 连接 连 到 主机 》 进行 登录 。 终 端 或 者 是 本 地 的 《直接 连接 ) 或 者 是 远程 的 (通过 调制 解 调 


器 连接 )。 在 这 两 种 情况 下 ， 登 录 都 经 由 内 核 中 的 终端 设备 驱动 程序 。 例 如 ,在 PDP-11 上 常用 的 设备 是 


DH-11 和 DZ-11。 因 为 连 到 主机 上 的 终端 设备 数 是 固定 的 ， 所 以 同时 的 登录 数 也 就 有 了 已 知 的 上 限 。 

随 着 位 映射 图 形 终端 的 出 现 ， 开 发 出 了 窗口 系统 ， 它 向 用 户 提 供 了 与 主机 系统 进行 交互 的 新 
方式 。 创 建 终端 窗口 的 应 用 也 被 开发 出 来 ， 它 仿真 了 基于 字符 的 终端 ， 使 得 用 户 可 以 用 熟悉 的 方 
式 《 即 通过 shell 命令 行 ) 与 主机 进行 交互 。 

现今 ， 某 些 平 台 人 允许 用 户 在 登录 后 启动 一 个 窗口 系统 ， 而 另 一些 平 台 则 自动 为 用 户 启动 窗口 
系统 。 在 后 面 一 种 情况 中 ， 用 户 可 能 仍然 需要 登录 ， 这 取决 于 窗口 系统 是 如 何 配置 的 〈 某 些 窗口 
系统 可 被 配置 成 自动 为 用 户 登 录 )。 

我 们 现在 描述 的 过 程 用 于 经 由 终端 登录 至 UNIX 系统 。 该 过 程 几 乎 与 所 使 用 的 终端 类 型 无 关 , 所 
使 用 的 终端 可 以 是 基于 字符 的 终端 、 仿 真 基 于 字符 终端 的 图 形 终端 ， 或 者 运行 窗口 系统 的 图 形 终端 。 

1. BSD 终端 登录 

在 过 去 35 EH, BSD 终端 登录 过 程 并 没有 多 少 改变 。 系 统管 理 者 创建 通常 名 为 /etcyVttys 
的 文件 ， 其 中 ， 每 个 终端 设备 都 有 一 行 ， 每 一 行 说 明 设 备 名 和 传 到 getty 程序 的 参数 。 例 如 ， 其 
中 一 个 参数 说 明了 终端 的 波 特 率 等 。 当 系统 自 举 时 ， 内 核 创 建 进程 ID 为 1 的 进程 ， 也 就 是 init 
进程 。init 进程 使 系统 进入 多 用 户 模式 。init 读 取 文 件 /etc/ttys， 对 每 一 个 允许 登录 的 终端 
设备 ，init 调用 一 次 fork， 它 所 生成 的 子 进程 则 exec getty 程序 。 这 种 情况 示 于 图 9-1 F. 
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9-1 中 所 有 进程 的 实际 用 户 ID 和 有 效用 户 ID 都 是 0 (也 就 是 说 ， 它 们 都 具有 超级 用 户 特 
BO. init 以 空 环境 exec getty 程序 。 

getty 对 终端 设备 调用 open 函数 ， 以 读 、 写 方式 将 终端 打开 。 如 果 设 备 是 调制 解 调 器 ， 则 
open 可 能 会 在 设备 驱动 程序 中 滞留 ， 直 到 用 户 拨号 调制 解 调 器 ， 并 且 线 路 被 接 通 。 一 旦 设备 被 打 
开 ， 则 文件 描述 符 0、1、2 就 被 设置 到 该 设备 。 然 后 getty WH “login: ”之 类 的 信息 ， 并 等 
待 用 户 键入 用 户 名 。 如 果 终 端 支持 多 种 速度 ， 则 getty 可 以 测试 特殊 字符 以 便 适 当地 更 改 终 端 速 
E RRR) ATF getty 程序 以 及 有 关 数 据 文件 (gettytab) 的 细节 ， 请 参阅 UNIX 系统 手册 。 

当 用 户 键入 了 用 户 名 后 ，getty 的 工作 就 完成 了 。 然 后 它 以 类 似 于 下 列 的 方式 调用 login 程序 : 


execle("/bin/login", "login", "-p", username, (char *)0, envp); 


(在 gettytab 文件 中 可 能 会 有 一 些 选项 使 其 调用 其 他 程序 ， 但 系统 默认 是 login JF). init 
以 一 个 空 环境 调用 getty. getty 以 终端 名 (如 TERM=foo， 其 中 终端 foo 的 类 型 取 自 gettytab 
文件 ) 和 在 gettytab 中 说 明 的 环境 字符 串 为 1ogin 创建 一 个 环境 (envp 参数 )。-p 标志 通知 
login 保留 传递 给 它 的 环境 ， 也 可 将 其 他 环境 字符 串 加 到 该 环境 中 ， 但 是 不 要 替换 它 。 图 9-2 5 
m [f login 刚 被 调用 后 这 些 进程 的 状态 。 


) 读 取 /etc/ttys 
EG 每 个 终端 执行 一 次 fork 
as” Te] 创建 空 环境 





init fork "4, 
p" A | ~ "4, | 
| fork 每 个 终端 执行 
| 一 次 fork exec 
打开 终端 设备 
CIFREI 0, 1, 2); 
读 用 户 名 
每 个 子 进 程 初始 环境 集 
exec getty ep 
图 9-1 为 允许 终端 登录 ，init 调用 的 进程 图 92 login 调用 后 进程 的 状态 


因为 最 初 的 init 进程 具有 超级 用 户 特权 ， 所 以 图 9-2 中 的 所 有 进程 都 有 超级 用 户 特权 。 图 
9-2 中 底部 3 个 进程 的 进程 ID 相同 ， 因 为 进程 ID 不 会 因 执 行 exec 而 改变 。 并 且 ， 除 了 最 初 的 
init 进程 ， 所 有 进程 的 父 进 程 ID 均 为 1。 

login 能 处 理 多 项 工作 。 因 为 它 得 到 了 用 户 名 ， 所 以 能 调用 getpwnam 取得 相应 用 户 的 口 
令 文件 登录 项 。 然 后 调用 getpass(3) 以 显示 提示 “Password: ", 接着 读 用 户 键 入 的 口令 CH 
然 ， 禁 止 回 显 用 户 键入 的 口令 )。 它 调用 crypt(3) 将 用 户 键入 的 口令 加 密 ， 并 与 该 用 户 在 阴影 口 
令 文件 中 登录 项 的 pw_passwd 字段 相 比 较 。 如 果 用 户 几 次 键入 的 口令 都 无 效 , 则 login 以 参数 
1 调用 exit 表示 登录 过 程 失 败 。 父 进程 (init) 了 解 到 子 进程 的 终止 情况 后 , 将 再 次 调用 fork, 
其 后 又 执行 了 getty， 对 此 终端 重复 上 述 过 程 。 

这 是 UNIX 系统 传统 的 用 户 身份 验证 过 程 。 现 代 UNIX 系统 已 发 展 到 支持 多 个 身份 验证 过 程 。 
例如 ，FreeBSD、Linux、Mac OS X 以 及 Solaris 都 支持 被 称 为 PAM (Pluggable Authentication 
Modules， 可 插入 的 身份 验证 模块 ) 的 更 加 灵活 的 方案 。PAM 允许 管理 人 员 配 置 使 用 何 种 身份 验 
证 方法 来 访问 那些 使 用 PAM 库 编 写 的 服务 。 
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如 果 应 用 程序 需要 验证 用 户 是 否 具 有 适当 的 权限 去 执行 某 个 服务 ， 那 么 我 们 要 么 将 身份 验证 
机 制 编 写 到 应 用 中 ， 要 人 么 使 用 PAM 库 得 到 同样 的 功能 。 使 用 PAM 的 优点 是 ， 管 理 员 可 以 基于 本 
地 策略 、 针 对 不 同 任务 配置 不 同 的 验证 用 户 身份 的 方法 。 


如 果 用 户 正 确 登 录 ，Login 就 将 完成 如 下 工作 。 


。 将 当前 工作 目录 更 改 为 该 用 户 的 起 始 目录 〈chair)。 


调用 chown 更 改 该 终端 的 所 有 权 ， 使 登录 用 户 成 为 它 的 所 有 者 。 

将 对 该 终端 设备 的 访问 权限 改变 成 “用 户 读 和 写 ”。 

调用 setgid 及 initgroups WEBER ID. 

用 login 得 到 的 所 有 信息 初始 化 环境 : 起 始 目 录 HOME), shell (SHELL). 用 户 名 (USER 


和 LOGNAME) 以 及 一 个 系统 默认 路 径 (PATH). 
。 login 进程 更 改 为 登录 用 户 的 用 户 ID (setuid) 并 调用 该 用 户 的 登录 shell, 其 方式 类 似 于 : 


execl ("/bin/sh", "-sh", (char *)0); 


argv[0]4699$ —4- 4E "—" A —4- 6, RFK shell 被 作为 登录 shell AA. shell 可 


| 以 查看 此 字符 ， 并 相应 地 修改 其 启动 过 程 。 


login 程序 实际 所 做 的 比 上 面 说 的 要 多 。 它 可 选择 地 打印 日 期 消息 (message-of-the-day) X 
件 、 检 查 新 邮件 以 及 执行 其 他 一 些 任务 。 本 章 中 我 们 主要 关心 上 面 所 说 的 功能 。 

回忆 8.11 节 中 对 setuid 函数 的 讨论 ， 因 为 setuid 是 由 超级 用 户 调用 的 ， 它 更 改 所 有 3 
个 用 户 ID: 实际 用 户 ID、 有 效用 户 ID 和 保存 的 用 户 ID. login 在 较 早 时 间 调 用 的 setgid 对 


所 有 3 个 组 ID 也 有 同样 效果 。 

至 此 ， 登 录用 户 的 登录 shell 开始 运行 。 其 父 进程 
ID 是 init 进程 (进程 ID 1)， 所 以 当 此 登录 shell 终止 
Bf, init 会 得 到 通知 ( 接 到 SIGCHLD 信和 号 )， 它 会 对 
该 终端 重复 全 部 上 述 过 程 。 登录 shell 的 文件 描述 符 0、 
1 和 2 设置 为 终端 设备 。 图 9-3 显示 了 这 种 安排 。 

现在 ， 登 录 shell 读 取 其 启动 文件 (Bourne shell 
和 Korn shell 是 .profile, GNU Bourne-again shell 
是 .bash profile. .bash login 或 .profile， 
C shell 是 .cshrc 和 .1login)。 这 些 启动 文件 通常 更 
改 某 些 环 境 变 量 并 增加 很 多 环境 变量 。 例 如 ， 大 多 数 
用 户 设置 他 们 自己 的 PATH 并 常常 提示 实际 终端 类 型 
(TERM)。 当 执行 完 启动 文件 后 ， 用 户 最 后 得 到 shell 
提示 符 ， 并 能 键入 命令 。 

2. Mac OS X 终端 登录 


进程 ID1 


登录 shell 


fd 0,1,2 


终端 设备 驱动 
} 硬 连 接 


图 9-3 终端 登录 完成 各 种 设置 后 的 进程 安排 


} 通过 getty 和 login 











Mac OS X 部 分 地 基于 FreeBSD， 所 以 其 终端 登录 进程 与 BSD 终端 登录 进程 的 工作 步骤 基本 


相同 。 但 是 ，Mac OS X 有 些 不 同 之 处 。 
。 init 的 工作 是 由 Launchd 完成 的 。 
。 一 开始 提供 的 就 是 图 形 终端 。 
3. Linux 终端 登录 


Linux 的 终端 登录 过 程 非常 类 似 于 BSD。 确 实 ，Linux login 命令 是 从 4.3BSD login 命令 
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派生 出 来 的 。BSD 登录 过 程 与 Linux 登录 过 程 的 主要 区 别 在 于 说 明 终 端 配置 的 方式 。 

在 System V 的 init 文件 格式 之 后 ， 有 些 Linux 发 行 版 的 init 程序 使 用 了 管理 文件 方式 。 在 
这 些 系统 中 , /etc/inittab 包含 配置 信息 , 指定 了 init 应 当 为 之 启动 getty 进程 的 各 终端 设备 。 

其 他 Linux 发 行 版 本 ， 如 最 近 的 Ubuntu 发 行 版 ， 配 有 称 为 “Upstart” 的 init 程序 。 使 用 存 
放 在 /etc/init 目录 的 * .conf 命名 的 配置 文件 。 例 如 ， 运 行 /dev/ttyt 上 的 getty 需要 的 
说 明 可 能 放 在 /etc/init/Vttyl .conf 文件 中 。 

根据 所 使 用 的 getty 版 本 的 不 同 ， 终 端的 特征 要 么 在 命令 行 中 说 明 (如 agetty)， 要 么 在 
/etc/gettydefs 文件 中 说 明 (如 mgetty)。 

4. Solaris 终端 登录 

Solaris 支持 两 种 形式 的 终端 登录 : (a) getty 方式 ， 这 与 前 面 对 BSD 终端 登录 的 说 明 一 样 ; 
(b) ttymon 登录 ， 这 是 SVR4 引入 的 一 种 新 特性 。 通 常 ，getty 用 于 控制 台 ，ttymon 则 用 于 
其 他 终端 的 登录 。 

ttymon 命令 是 服务 访问 设施 〈Service Access Facility, SAF) 的 一 部 分 。SAF 的 目的 是 用 一 
致 的 方式 对 提供 系统 访问 的 服务 进行 管理 (关于 SAF 的 详细 信息 可 以 参见 Rago[1993] 的 第 6 章 )。 
按照 本 书 的 宗旨 ， 我 们 只 简单 说 明 从 init 到 登录 shell 之 间 不 同 的 工作 步骤 ， 最 后 结果 与 图 9-3 
HARIRI. init 是 sac (service access controller, 服务 访问 控制 器 ) 的 父 进程 , sac 调用 fork, 
然后 ， 当 系统 进入 多 用 户 状态 时 ， 其 子 进程 执行 ttymon 程序 。ttymon 监控 在 配置 文件 中 列 出 
的 所 有 终端 端口 ， 当 用 户 键 入 登录 名 时 ， 它 调用 一 次 fork。 在 此 之 后 ttymon 的 子 进程 执行 
Login， 它 向 用 户 发 出 提示 ， 要 求 输入 口令 字 。 一 有 旦 完成 这 一 处 理 ，Login 执行 登录 用 户 的 登录 
shell， 于 是 到 达 了 图 9-3 中 所 示 的 位 置 。 一 个 区 别 是 用 户 登 录 shell 的 父 进程 现在 是 ttymon, m 
在 getty 登录 中 ， 登 录 shell 的 父 进程 是 init. 


9.3 网络 登录 


通过 串 行 终端 登录 至 系统 和 经 由 网 络 登录 至 系统 两 者 之 间 的 主要 〈 物 理 上 的 ) KA: 网 络 
登录 时 ， 在 终端 和 计算 机 之 间 的 连接 不 再 是 点 到 点 的 。 在 网 络 登录 情况 下 ，1Login 仅仅 是 一 种 可 
用 的 服务 ， 这 与 其 他 网 络 服务 (如 FTP BR SMTP) 的 性 质 相同 。 

在 上 节 所 述 的 终端 登录 中 ，init 知道 哪些 终端 设备 可 用 来 进行 登录 ， 并 为 每 个 设备 生成 一 
getty 进程 。 但 是 ， 对 网 络 登 录 情 况 则 有 所 不 同 ， 所 有 登录 都 经 由 内 核 的 网 络 接口 驱动 程 
序 〈 如 以 太 网 驱动 程序 )， 而 且 事 先 并 不 知道 将 会 有 多 少 这 样 的 登录 。 因 此 必须 等 待 一 个 网 络 连 
接 请 求 的 到 达 ， 而 不 是 使 一 个 进程 等 待 每 一 个 可 能 的 登录 。 

为 使 同一 个 软件 既 能 处 理 终端 登录 , 又 能 处 理 网 络 登录 , 系统 使 用 了 一 种 称 为 伪 终 端 (pseudo 
terminal) 的 软件 驱动 程序 ， 它 仿真 串 行 终端 的 运行 行为 ， 并 将 终端 操作 映射 为 网 络 操作 ， 反 之 亦 
然 。( 在 第 19 章 ， 我 们 将 详细 说 明 伪 终 端 。) 

1. BSD 网 络 登 录 

Æ BSD 中 ,有 一 个 inetd 进程 《有 时 称 为 因特网 超级 服务 器 )， 它 等 待 大 多 数 网 络 连接 。 本 
节 将 说 明 BSD 网 络 登 录 中 所 涉及 的 进程 序列 。 关 于 这 些 进程 的 网 络 程序 设计 方面 的 细节 请 参阅 
Stevens. Fenner 和 Rudoff [2004]. 

作为 系统 启动 的 一 部 分 ，init 调用 一 个 shell， 使 其 执行 shell 脚本 /etc/rc。 由 此 shell 脚本 启动 
一 个 守护 进程 inetd. 一旦 此 shell HEIE, inetd 的 父 进程 就 变 成 init. inetd 等 待 TCP/IP XE 
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接 请 求 到 达 主 机 ， 而 当 一 个 连接 请 求 到 达 时 ， 它 执行 一 次 fork, 然后 生成 的 子 进程 exec 适当 的 程序 。 

假定 一 个 对 于 TELNET 服务 进程 的 TCP 连接 请 求 到 达 。TELNET 是 使 用 TCP 协议 的 远程 登 
录 应 用 程序 。 在 另 一 台 主 机 〈 它 通过 某 种 形式 的 网 络 与 服务 进程 主机 相连 接 ) 上 的 用 户 ， 或 在 同 
一 个 主机 上 的 一 个 用 户 启 动 TELNET 客户 进程 ， 由 此 启动 登录 过 程 : 


telnet hostname 


该 客户 进程 打开 一 个 到 hostname 主机 的 TCP 连接 ， 在 hostname 主机 上 启动 的 程序 被 称 为 TELNET 
服务 进程 。 然 后 ， 客 户 进程 和 服务 进程 之 间 使 用 TELNET 应 用 协议 通过 TCP 连接 交换 数据 。 启 动 客 
户 进程 的 用 户 现在 登录 到 了 服务 进程 所 在 的 主机 (当然 , 假定 用 户 在 服务 进程 主机 上 有 一 个 有 效 的 账 
号 )。 图 9-4 显示 了 在 执行 TELNET 服务 进程 RA telneta) 中 所 涉及 的 进程 序列 。 

进程 ID1 


init 


系统 出 现 多 用 户 时 ， 
: /bin/sh 中 的 fork/exec, 
PAT shell MA etc/rc 
M TELNET 客户 进程 来 的 
TCP 连接 请 求 
从 TELNET 客户 进程 来 
的 连接 请 求 到 达 时 





图 9-4 执行 TELNET 服务 进程 时 调用 的 进程 序列 
An, telnetd 进程 打开 一 个 伪 终 端 设备 ， 并 用 fork 分 成 两 个 进程 。 父 进程 处 理 通过 网 络 
连接 的 通信 , 子 进程 则 执行 login 程序 。 父 进程 和 子 进程 通过 伪 终 端 相 连接 。 在 调用 exec 之 前 ， 
子 进程 使 其 文件 描述 符 0、1、2 与 伪 终 端 相连 。 如 果 登 
录 正 确 , login 就 执行 9.2 节 中 所 述 的 同样 步骤 一 一 更 
改 当 前 工作 目录 为 起 始 目 录 、 设 置 登录 用 户 的 组 ID. 
FAP ID 以 及 初始 环境 。 然 后 login 调用 exec 将 其 m inetd, telnetd, 


进程 ID1 


H login 


自身 替换 为 登录 用 户 的 登录 shell. Bl 9-5 显示 了 到 达 
这 一 点 时 的 进程 安排 。 登录 shell 
很 明显 ,在 伪 终 端 设备 驱动 程序 和 实际 终端 用 户 之 
间 进 行 了 很 多 工作 。 第 19 章 详 细 说 明 伪 终端 时 ， 我 们 
将 介绍 与 这 种 安排 相关 的 所 有 进程 。 
需要 理解 的 重点 是 : 当 通 过 终端 〈 见 图 9-3) 或 网 —— ei 
络 ( 见 图 9-5) 登录 时 ， 我 们 得 到 一 个 登录 shell, HER : a 客户 的 网 络 链接 
准 输入 、 标 准 输 出 和 标准 错误 要 么 连接 到 一 个 终端 设 
备 ， 要 么 连接 到 一 个 伪 终 端 设备 上 。 在 后 面 几 节 中 我 们 
会 了 解 到 这 一 登录 shell 是 一 个 POSIX.1 会 话 的 开始 ， 图 9-5 网 络 登录 完成 各 种 设置 后 的 进程 安排 
而 此 终端 或 伪 终 端 则 是 会 话 的 控制 终端 。 
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2. Mac OS X 网 络 登 录 
Mac OS X 是 部 分 地 基于 FreeBSD 的 ， 所 以 其 网 络 登录 与 BSD 网 络 登 录 基本 相同 。 但 Mac OS 
X Etelnet 守护 进程 是 从 1aunchd 运行 的 。 292 


| telnet 守护 进程 在 Mac OS X 中 默认 是 禁用 的 ( 虽然 可 以 通过 launchct1(1) 命 令 启 用 )。 
. Mac OS X 上 执行 网 络 登 录 的 更 好 办 法 是 用 使 Ssh ( 安全 shell 命令 )。 


3. Linux 网 络 登录 

除了 有 些 版 本 使 用 扩展 的 因特网 服务 守护 进程 xinetd RF inetd 进程 外 , Linux 网 络 登录 
的 其 他 方面 与 BSD 网 络 登 录 相 同 。xinetd 进程 对 它 所 启动 的 各 种 服务 的 控制 比 ineta 提供 的 
控制 更 加 精细 。 

4. Solaris 网 络 登录 

Solaris 中 网 络 登 录 的 工作 过 程 与 BSD 和 Linux 中 的 步骤 几乎 一 样 。 同 样 使 用 了 类 似 于 BSD 
版 的 inetd 服务 进程 ,但 是 在 Solaris 中 ，inetd 服务 进程 在 服务 管理 设施 (Service Management 
Facility, SMF) 下 作为 restarter 运行 。 这 个 restarter 是 守护 进程 ， 它 负责 启动 和 监视 其 他 守护 进 
程 ， 如 果 其 他 守护 进程 失败 的 话 ，restarter 重启 这 些 失 效 进程 。 虽 然 inetd 服务 程序 由 SMF 中 
的 主 restarter 启动 ， 但 实际 上 主 restarter 是 由 init 程序 启动 的 ， 最 后 得 到 的 结果 与 图 9-5 中 一 样 。 


Solaris 服务 管理 设施 是 管理 和 监视 系统 服务 的 框架 ,提供 了 一 种 从 影响 系统 服务 的 故障 中 恢复 的 
”途径 。 关 于 服务 管理 设施 的 更 多 内 容 ， 可 参阅 Adams[2005] 以 及 Solaris 系统 手册 smf(5) 和 inetd(1M)。 


9.4 ”进程 组 


每 个 进程 除了 有 一 进程 ID 之 外 ， 还 属于 一 个 进程 组 ， 第 10 章 讨论 信号 时 还 会 涉及 进程 组 。 
进程 组 是 一 个 或 多 个 进程 的 集合 。 通 常 ， 它 们 是 在 同一 作业 中 结合 起 来 的 〈9.8 节 将 详细 讨 
论 作 业 控 制 )， 同 一 进程 组 中 的 各 进程 接收 来 自 同一 终端 的 各 种 信号。 每 个 进程 组 有 一 个 唯一 的 
进程 组 DD。 进程 组 ID 类 似 于 进程 人 D 一 一 它 是 一 个 正 整 数 ， 并 可 存放 在 pia t 数据 类 型 中 。 函 
数 getpgrp 返回 调用 进程 的 进程 组 ID。 
#include «unistd.h» 
pid t getpgrp(void); 
返回 值 : 调用 进程 的 进程 组 ID 
在 早期 BSD 派生 的 系统 中 ， 该 水 数 的 参数 是 pi4， 返 回 该 进程 的 进程 组 ID. Single UNIX 
Specification 定义 了 getpgid 函数 模仿 此 种 运行 行为 。 
finclude <unistd.h> 


pid t getpgid(pid t pid); 





返回 值 : HM, IAEA ID; 戎 出 错 ， 返 回 -1 


若 pid 是 0, 返回 调用 进程 的 进程 组 ID, TE. 
getpgid(0); 
等 价 于 


getpgrp(); 
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每 个 进程 组 有 一 个 组 长 进程 。 组 长 进程 的 进程 组 ID 等 于 其 进程 ID。 

进程 组 组 长 可 以 创建 一 个 进程 组 、 创 建 该 组 中 的 进程 ， 然 后 终止 。 只 要 在 某 个 进程 组 中 有 一 
个 进程 存在 ， 则 该 进程 组 就 存在 ， 这 与 其 组 长 进程 是 否 终止 无 关 。 从 进程 组 创建 开始 到 其 中 最 后 
一 个 进程 离开 为 止 的 时 间 区 闻 称 为 进程 组 的 生命 期 。 某 个 进程 组 中 的 最 后 一 个 进程 可 以 终止 ， 也 
可 以 转移 到 另 一 个 进程 组 。 

进程 调用 setpgid 可 以 加 入 一 个 现 有 的 进程 组 或 者 创建 一 个 新 进程 组 〈 下 一 节 中 将 说 明 用 
setsid 也 可 以 创建 一 个 新 的 进程 组 )。 





setpgid 函数 将 pid 进程 的 进程 组 ID 设置 为 pgid。 如 果 这 两 个 参数 相等 ， 则 由 pid 指定 的 
进程 变 成 进程 组 组 长 。 如 果 pid 是 0， 则 使 用 调用 者 的 进程 ID。 另 外 ， 如 果 pgid 是 0， 则 由 pid 
指定 的 进程 D 用 作 进 程 组 ID。 

一 个 进程 只 能 为 它 自己 或 它 的 子 进程 设置 进程 组 ID。 在 它 的 子 进 程 调用 了 exec 后 ， 它 就 不 
再 更 改 该 子 进程 的 进程 组 ID. 

在 大 多 数 作业 控制 shell F, Æ fork 之 后 调用 此 函数 ， 使 父 进程 设置 其 子 进程 的 进程 组 ID, 
并 且 也 使 子 进程 设置 其 自己 的 进程 组 DD。 这 两 个 调用 中 有 一 个 是 元 余 的 , 但 让 父 进 程 和 子 进程 都 
这 样 做 可 以 保证 ， 在 父 进程 和 子 进程 认为 子 进 程 已 进入 了 该 进程 组 之 前 ， 这 确实 已 经 发 生 了 。 如 
果 不 这 样 做 ， 在 fork 之 后 ， 由 于 父 进程 和 子 进程 运行 的 先后 次 序 不 确定 ， 会 因为 子 进程 的 组 员 
身份 取决 于 哪个 进程 首先 执行 而 产生 竞争 条 件 。 

在 讨论 信号 时 ， 将 说 明 如 何 将 一 个 信号 发 送 给 一 个 进程 (由 其 进程 ID 标识 ) 或 发 送 给 一 个 
进程 组 (由 进程 组 ID 标识 )。 类 似 地 ，8.6 节 的 waitpid 函数 可 被 用 来 等 待 一 个 进程 或 者 指定 进 

程 组 中 的 一 个 进程 终止 。 


9.5 会 话 


会 话 (session) 是 一 个 或 多 个 进程 组 的 集合 。 例 如 ， 可 以 具有 图 9-6 中 所 示 的 安排 。 其 中 ， 
在 一 个 会 话 中 有 3 个 进程 组 。 


会 话 
9-6 ”进程 组 和 会 话 中 的 进程 安排 
通常 是 由 shell 的 管道 将 几 个 进程 编 成 一 组 的 。 例 如 ， 图 9-6 中 的 安排 可 能 是 由 下 列 形式 的 shell 
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命令 形成 的 ， 


procl | proc2 & 
proc3 | proc4 | proc5 


进程 调用 setsid 函数 建立 一 个 新 会 话 。 


#include <unistd.h> 


pid_t setsid(void); 


AMA: 若 成 功 ， 返 回 进程 组 DD. 若 出 错 ， 返 回 -1 





如 果 调 用 此 函数 的 进程 不 是 一 个 进程 组 的 组 长 ， 则 此 函数 创建 一 个 新 会 话 。 有 具体 会 发 生 以 下 3 件 事 。 

C1) 该 进程 变 成 新 会 话 的 会 话 首 进程 (session leader， 会 话 首 进 程 是 创建 该 会 话 的 进程 )。 此 
时 ， 该 进程 是 新 会 话 中 的 唯一 进程 。 

(2) 该 进程 成 为 一 个 新 进程 组 的 组 长 进程 。 新 进程 组 ID 是 该 调用 进程 的 进程 ID. 

(3) 该 进程 没有 控制 终端 〈 下 一 节 讨 论 控制 终端 )。 如 果 在 调用 setsid 之 前 该 进程 有 一 个 
控制 终端 ， 那 么 这 种 联系 也 被 切断 。 

如 果 该 调用 进程 已 经 是 一 个 进程 组 的 组 长 ， 则 此 函数 返回 出 错 。 为 了 保证 不 处 于 这 种 情况 ， 通 
常 先 调用 fork， 然 后 使 其 父 进程 终止 ， 而 子 进程 则 继续 。 因 为 子 进 程 继 承 了 父 进程 的 进程 组 ID， 
而 其 进程 ID 则 是 新 分 配 的， 两 者 不 可 能 相等 ， 这 就 保证 了 子 进程 不 是 一 个 进程 组 的 组 长 。 

Single UNIX Specification 只 说 明了 会 话 首 进程 ,而 没有 类 似 于 进程 ID 和 进程 组 ID 的 会 话 ID。 
显然 ， 会 话 首 进程 是 具有 唯一 进程 ID 的 单个 进程 ， 所 以 可 以 将 会 话 首 进 程 的 进程 ID 视 为 会 话 ID。 
会 话 ID 这 一 概念 是 由 SVR4 引入 的 。 历 史上 ， 基 于 BD 的 系统 并 不 支持 这 个 概念 ， 但 后 来 改 弦 
Fy Wh FT SIE ID. getsid 函数 返回 会 话 首 进程 的 进程 组 D. 


| 一 些 实现 (如 Solaris) 与 Single UNIX Specification 保持 一 致 ， 在 实践 中 避免 使 用 “会 话 ID” 
”这 一 短语 ,而 是 将 此 称 为 “会 话 首 进程 的 进程 组 ID”。 会 话 首 进程 总 是 一 个 进程 组 的 组 长 进程 ， 
”所 以 两 者 是 等 价 的 。 


#include «unistd.h» 


pid t getsid(pid t pid); 





返回 值 ， 着 成 功 ， 返 回 会 话 次 进程 的 进程 组 ID; H, gE- 


如 车 pid 是 0. getsid 返回 调用 进程 的 会 话 首 进程 的 进程 组 中。 出 于 安全 方面 的 考虑 ， 一 
些 实现 有 如 下 限制 ， 如若 pid 并 不 属于 调用 者 所 在 的 会 话 ， 那 么 调用 进程 就 不 能 得 到 该 会 话 首 进 
程 的 进程 组 ID。 


9.6 ”控制 终端 


会 话 和 进程 组 还 有 一 些 其 他 特性 。 

。 一 个 会 话 可 以 有 一 个 控制 终端 (controlling terminal)。 这 通常 是 终端 设备 〈 在 终端 登录 情 
况 下 ) 或 伪 终 端 设备 〈 在 网 络 登录 情况 下 )。 

。 建立 与 控制 终端 连接 的 会 话 首 进程 被 称 为 控制 进程 〈controlling process). 

。 一 个 会 话 中 的 几 个 进程 组 可 被 分 成 一 个 前 台 进 程 组 〈foreground process group) 以 及 一 个 
或 多 个 后 台 进 程 组 (background process group). 
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如 果 一 个 会 话 有 一 个 控制 终端 ， 则 它 有 一 个 前 台 进程 组 ， 其 他 进程 组 为 后 台 进 程 组 。 

无 论 何 时 键入 终端 的 中 断 键 (常常 是 Delete 或 CtrlHC)， 都 会 将 中 断 信号 发 送 至 前 台 进 程 
组 的 所 有 进程 。 

无 论 何 时 键入 终端 的 退出 键 〈 常 常 是 CalN\)， 都 会 将 退出 信号 发 送 至 前 台 进 程 组 的 所 有 进程 。 
如 果 终 端 接口 检测 到 调制 解 调 器 (或 网 络 ) 已 经 新 开 连 接 ， 则 将 挂 断 信和 号 发 送 至 控制 进 
程 (会 话 首 进 程 )。 


这 些 特性 示 于 图 9-7 中 。 






控制 终端 


图 9-7 进程 组 、 会 话 和 控制 终端 


i POSIX.1 将 如 何 分 配 一 个 控制 终端 的 机 制 交 给 具体 实现 来 选择 。19.4 节 中 将 说 明 实 际 步骤 。 

O 当 会 话 首 进程 打开 第 一 个 尚未 与 一 个 会 话 相关 联 的 终端 设备 时 ， 只 要 在 调用 open 时 没有 指 
| 定 O_NOCTTY 标志 ( 见 3.3 35 ), System V 派生 的 系统 将 此 作为 控制 终端 分 配给 此 会 话 。 

当 会 话 首 进 程 用 TIOCSCTTY 作为 request 参数 ( 第 三 个 参数 是 空 指针 AM ioctl 时 , 基于 BSD 
| 的 系统 为 会 话 分 配 控制 终端 。 为 使 此 调用 成 功 执行 ， 此 会 话 不 能 已 经 有 一 个 控制 终端 (通常 ioct1 A 
| 用 紧 跟 在 setsid 调用 之 后 , setsid 保证 此 进程 是 一 个 没有 控制 终端 的 会 话 首 进程 ) RTARSR 
| 式 支 持 其 他 系统 以 外 ， 基 于 BSD 的 系统 不 使 用 POSIX.1 中 对 open 函数 所 说 明 的 O_NOCTTY 标志 。 

| 图 9-8 总 结 了 本 书 讨论 的 4 个 平台 分 配 控制 终端 的 方式 。 注 意 ， 虽 然 Mac OS X 106.8 是 从 
BSD 派生 出 来 的 ， 但 其 分 配 控 制 终 端的 方式 如 同 System V, 


FreeBSD 8.0 | Linux3.2.0 | MacOS X 10.6.8 | Solaris 10 


没有 指定 O_NOCTTY 的 open 
TIOCSCTTY ioctl 命令 


9-8 不 同 的 实现 分 配 控制 终端 的 方式 


» 










有 时 不 管 标准 输入 、 标 准 输 出 是 否 重 定向 ， 程 序 都 要 与 控制 终端 交互 作用 。 保 证 程序 能 与 控 
制 终端 对 话 的 方法 是 open 文件 /dev/tty。 在 内 核 中 ， 此 特殊 文件 是 控制 终端 的 同 义 语 。 目 然 
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地 ， 如 果 程 序 没 有 控制 终端 ， 则 对 于 此 设备 的 open 将 失败 。 

典型 的 例子 是 用 于 读 口 令 的 getpass(3) 函 数 〈 终 端 回 显 被 关闭 )。 这 一 函数 由 crypt(1) 程 
序 调用 ， 并 可 用 于 管道 中 。 例 如 ， 

crypt < salaries | lpr 
将 文件 salaries 解密 ， 然 后 经 由 管道 将 输出 送 至 打印 缓冲 服务 程序 。 因 为 crypt 从 其 标准 
输入 读 输 入 文件 ， 所 以 标准 输入 不 能 用 于 输入 口令 。 而 且 ，crypt 经 过 了 设计 ， 因 此 每 次 运行 
此 程序 时 都 应 输入 加 密 口 令 , 这 样 也 就 阻止 了 用 户 将 口令 存放 在 文件 中 (这 会 造成 安全 性 漏洞 )。 

已 经 知道 有 一 些 方法 可 以 破译 crypt 程序 使 用 的 密码 。 关 于 加 密 文件 的 详细 情况 请 参见 
Garfinkel 等 [2003]。 


9.7 函数 tcgetpgrp. tcsetpgrp 和 tcgetsid 


需要 有 一 种 方法 来 通知 内 核 哪 一 个 进程 组 是 前 台 进 程 组 ， 这 样 ， 终 端 设 备 驱动 程序 就 能 知道 
将 终端 输入 和 终端 产生 的 信号 发 送 到 何 处 〈 见 图 9-7)。 
#include <unistd.h> 


pid t tcgetpgrp(int fd); 


返回 值 ， 若 成 功 ， 返 回 前 台 进 程 组 ID; AHH, gE- 


int tcsetpgrp(int fd, pid t pgrpid); 





返回 值 ， 若 成 功 ， 返 回 0， 若 出错， 返回 -1 


函数 tcgetpgrp 返回 前 台 进 程 组 ID， 它 与 在 应 上 打开 的 终端 相关 联 。 

如 果 进 程 有 一 个 控制 终端 ， 则 该 进程 可 以 调用 tcsetpgrp 将 前 台 进 程 组 ID REX perpid. 
pgrp 这 值 应 当 是 在 同一 会 话 中 的 一 个 进程 组 的 ID。 应 必须 引用 该 会 话 的 控制 终端 。 

大 多 数 应 用 程序 并 不 直接 调用 这 两 个 函数 。 它 们 通常 由 作业 控制 shell 调用 。 

给 出 控制 TTY 的 文件 描述 符 ， 通 过 tcgetsid 函数 ， 应 用 程序 就 能 获得 会 话 首 进程 的 进程 





需要 管理 控制 终端 的 应 用 程序 可 以 调用 tcgetsid 函数 识别 出 控制 终端 的 会 话 首 进 程 的 会 
话 ID“〈 它 等 价 于 会 话 首 进程 的 进程 组 ID )。 


9.8 ”作业 控制 


作业 控制 是 BSD 在 1980 年 左右 增加 的 一 个 特性 。. 它 允许 在 一 个 终端 上 启动 多 个 作业 (进程 组 )， 
它 控 制 哪 一 个 作业 可 以 访问 该 终端 以 及 哪些 作业 在 后 台 运 行 。 作 业 控 制 要 求 以 下 3 种 形式 的 支持 。 

(OD 支持 作业 控制 的 shell. 

(2) 内 核 中 的 终端 驱动 程序 必须 支持 作业 控制 。 

(3) 内 核 必 须 提供 对 某 些 作业 控制 信号 的 支持 。 
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| SVR3 提供 了 一 种 不 同 的 作业 控制 ， 称 为 shell Æ (shell layer )。 但 是 POSIX.) 选择 了 BSD 形 
式 的 作业 控制 ， 这 也 是 我 们 在 这 里 所 说 明 的 。POSIX.1 的 早期 版 本 中 ， 对 作业 控制 的 支持 是 可 选 
择 的 ， 现 在 则 要 求 所 有 平台 都 支持 它 。 


从 shell 使 用 作业 控制 功能 的 角度 观察 , 用 户 可 以 在 前 台 或 后 台 启 动 一 个 作业 。 一 个 作业 只 是 
几 个 进程 的 集合 ， 通 常 是 一 个 进程 管道 。 例 如 : 


在 前 台 启 动 了 只 有 一 个 进程 组 成 的 作业 。 下 面 的 命令 : 


pr *.c | lpr & 
make all & 


在 后 台 启 动 了 两 个 作业 。 这 两 个 后 台 作 业 调 用 的 所 有 进程 都 在 后 台 运行 。 

如 前 所 述 , 我 们 需要 一 个 支持 作业 控制 的 shell 以 使 用 由 作业 控制 提供 的 功能 。 对 于 早期 的 系 
统 , shell 是 否 支 持 作业 控制 比较 易于 说 明 。C shell 支持 作业 控制 , Bourne shell 不 支持 , 而 Korn shell 
能 否 支持 作业 控制 取决 于 主机 是 否 支持 作业 控制 .但 是 现在 C shell 已 被 移植 到 并 不 支持 作业 控制 的 
系统 上 (如 System V 的 早期 版 本 )， 而 当 用 名 字 jsh 而 不 是 用 sh 调用 SVR4 中 的 Bourne shell AY, 
它 支持 作业 控制 。 如 果 主 机 支持 作业 控制 ， 则 Kom shell 继续 支持 作业 控制 。Bourne-again shell 也 
支持 作业 控制 。 各 种 shell 之 间 的 差别 无 关 紧 要 时 ， 我 们 将 只 是 一 般 地 说 明 支 持 作 业 控 制 的 shell 和 
不 支持 作业 控制 的 shell。 

当 启 动 一 个 后 台 作 业 时 ，shell 赋予 它 一 个 作业 标识 符 ， 并 打印 一 个 或 多 个 进程 ID。 下面 的 脚 
本 显示 了 Korn shell 是 如 何 处 理 这 一 点 的 。 


$ make all > Make.out & 
[1] 1475 

$ pr *.c | lpr & 

[2] 1490 


$ 键入 回 车 
[2] + Done pr *.c | ipr & 
[1] * Done make ali » Make.out & 


make 是 作业 编号 1， 所 启动 的 进程 ID 是 1475。 下 一 个 管道 是 作业 编号 2， 其 第 一 个 进程 的 进程 ID 
是 1490。 当 作业 完成 而 且 键 入 回 车 时 ，shell 通知 作业 已 经 完成 。 键 入 回 车 是 为 了 让 shell 打印 其 提示 
fT. shell 并 不 在 任意 时 刻 打 印 后 台 作业 的 状态 改变 一 一 它 只 在 打印 其 提示 符 让 用 户 输入 新 的 命令 行 之 
前 才 这 样 做 。 如 果 不 这 样 处 理 ， 则 当 我 们 正 输入 一 行 时 ， 它 也 可 能 输出 ， 于 是 ， 就 会 引起 混乱 。 

我 们 可 以 键入 一 个 影响 前 台 作 业 的 特殊 字符 一 一 挂 起 键 (通常 采用 Ctri+tZ)， 与 终端 驱动 程 
序 进行 交互 作用 。 键入 此 字符 使 终端 驱动 程序 将 信号 SIGTSTP 发 送 至 前 台 进 程 组 中 的 所 有 进程 ， 
后 台 进 程 组 作业 则 不 受 影 响 。 实 际 上 有 3 个 特殊 字符 可 使 终端 驱动 程序 产生 信号 ， 并 将 它们 发 送 
至 前 台 进程 组 ， 它 们 是 : 

e 中 断 字 符 ( 一 般 采 用 Delete 或 Ctrlt+C)》 产 生 SIGINT: 

e. 退出 字符 (一般 采 用 Ctr) 产生 SIGQUIT: 

e 挂 起 字符 (一 般 采用 Ctrl+Z) 产生 SIGTSTP. 

第 18 章 中 将 说 明 可 将 这 3 个 字符 更 改 为 用 户 选 择 的 任意 其 他 字符 ， 以 及 如 何 使 终端 驱动 程 
序 不 处 理 这 些 特殊 字符 。 

终端 驱动 程序 必须 处 理 与 作业 控制 有 关 的 另 一 种 情况 。 我 们 可 以 有 一 个 前 台 作 业 , 若干 个 后 台 作 
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业 ,， 这 些 作业 中 哪 一 个 接收 我 们 在 终端 上 键入 的 字符 呢 ? 只 有 前 台 作业 接收 终端 输入 。 如 果 后 台 作 业 
试图 读 终端 ， 这 并 不 是 一 个 错误 ， 但 是 终端 驱动 程序 将 检测 这 种 情况 ， 并 且 向 后 台 作 业 发 送 一 个 特定 
信号 SIGTTIN。 该 信号 通常 会 停止 此 后 台 作 业 ， 而 shell 则 向 有 关 用 户 发 出 这 种 情况 的 通知 ， 然 后 用 ， 
户 就 可 用 shell 命令 将 此 作业 转 为 前 台 作业 运行 ， 于 是 它 就 可 读 终 端 。 下 列 操 作 过 程 显示 了 这 一 点 : 


$ cat > temp.foo & 在 后 台 启 动 ， 但 将 从 标准 输入 读 

[1] 1681 

$ 键入 回 车 

[1] + Stopped (SIGTTIN) cat » temp.foo & 

$ fg $1 使 1 号 作业 成 为 前 人 台 作 业 

cat > temp.foo shell 告诉 我 们 现在 哪 一 个 作业 在 前 台 
hello, world 输入 一 行 

^D 键入 文件 结束 符 

$ cat temp.foo 检查 该 行 已 送 入 文件 


hello, world 


| 注意 ,这 个 例子 在 Mac OS X 10.6.8 上 不 起 作用 。 在 试图 把 cat 命令 放 到 前 台 时 ，read 返回 
| 失败 ， 并 将 errno 设 为 EINTR。Mac OS X X AT FreeBSD 的 ， 在 FreeBSD 下 本 例 运行 良好 ， 
， 固 此 这 应 该 是 Mac OSX 的 一 个 bug. 

shell 在 后 台 启 动 cat 进程 ， 但 是 当 cat 试图 读 其 标准 输入 〈 控 制 终端 ) 时 ， 终 端 驱 动 程序 
知道 它 是 个 后 台 作 业 ， 于 是 将 SIGTTIN 信和 号 送 至 该 后 台 作 业 。shell 检测 到 其 子 进程 的 状态 改变 
(回忆 8.6 节 中 对 wait 和 waitpid 函数 的 讨论 )， 并 通知 我 们 该 作业 已 被 停止 。 然 后 ， 我 们 用 
shell 的 £g 命令 将 此 停止 的 作业 送 入 前 台 运 行 〈 关 于 作业 控制 命令 ， 如 fg 和 bg 的 详细 情况 ， 以 
及 标识 不 同 作业 的 各 种 方法 请 参阅 有 关 shell 的 手册 页 )。 这 样 做 使 shell 将 此 作业 转 为 前 台 进 程 组 
(tcsetpgrp)， 并 将 继续 信号 “SIGCONT) 送 给 该 进程 组 。 因 为 该 作业 现在 前 台 进 程 组 中 ， 所 
以 它 可 以 读 控制 终端 。 

如 果 后 台 作 业 输 出 到 控制 终端 又 将 发 生 什 么 呢 ? 这 是 一 个 我 们 可 以 允许 或 禁止 的 选项 。 通 
常 ， 可 以 用 stty(1) 命 令 改变 这 一 选项 〈 第 18 章 将 说 明 在 程序 中 如 何 改变 这 一 选项 )。 下 面 显示 
了 这 种 操作 过 程 ; 


$ cat temp.foo & 在 后 台 执 行 

[1] 1719 

$ hello, world 提示 符 后 出 现 后 台 作 业 的 输出 
键入 回 车 

[1] + Done cat temp.foo & 

$ stty tostop 禁止 后 台 作 业 输 出 至 控制 终端 

$ cat temp.foo & 在 后 台 再 试 一 次 

[1] 1721 

$ 键入 回 车 ， 发 现 作 业已 停止 

[1] + Stopped(SIGTTOU) cat temp.foo & 

$ fg $1 在 前 台 恢 复 停止 的 作业 

cat temp .foo shell 告诉 我 们 现在 哪 一 个 作业 在 前 台 

hello, world 这 是 该 作业 的 输出 


在 用 户 禁 止 后 台 作 业 向 控制 终端 写 时 ， 该 作业 的 cac 命令 试图 写 其 标准 输出 ， 此 时 ， 终 端 驱 动 程 
序 识别 出 该 写 操作 来 自 于 后 台 进 程 ， 于 是 向 该 作业 发 送 sicTTOU 信和 号，cat 进程 阻塞 。 与 上 面 
的 例子 一 样 ， 当 用 户 使 用 shell 的 fg 命令 将 该 作业 转 为 前 台 时 ， 该 作业 继续 执行 直至 完成 。 

图 9-9 总 结 了 前 面 已 说 明 的 作业 控制 的 某 些 功能 。 穿 过 终端 驱动 程序 框 的 实 线 表 明 终 端 TO 


240 第 9 章 进程 关系 


和 终端 产生 的 信和 号 总 是 从 前 台 进 程 组 连接 到 实际 终端 。 对 应 于 SIGmToU 信号 的 虚线 表明 后 台 进 
程 组 进程 的 输出 是 否 出 现在 终端 是 可 选择 的 。 


init.inetd m launchd 


getty ik 
telnetd 





在 setsid 后 , exec 
建立 控制 终端 





— — — Ao RA A M Á å- — oo AAA „X — o a a — — — — -——————-— 


图 9-9 对 于 前 台 、 后 台 作业 以 及 终端 驱动 程序 的 作业 控制 功能 总 结 


是 否 需 要 作业 控制 是 一 个 有 争议 的 问题 。 作 业 控 制 是 在 窗口 终端 广泛 得 到 应 用 之 前 设计 和 实现 

的 。 很 多 人 认为 设计 得 好 的 窗口 系统 已 经 免除 了 对 作业 控制 的 需要 。 某 些 人 抱怨 作业 控制 的 实现 要 求 

[302] 得 到 内 核 、 终 端 驱 动 程序 、shell 以 及 某 些 应 用 程序 的 支持 ， 是 吃力 不 讨好 的 事情 。 某 些 人 在 窗口 系统 
中 使 用 作业 控制 ， 他 们 认为 两 者 都 需要 。 不 管 你 的 意见 如 何 ， 作 业 控 制 都 是 POSIX.1 要 求 的 部 分 。 


9.9 shell 执行 程序 


让 我 们 检验 一 下 shell 是 如 何 执行 程序 的 ， 以 及 这 与 进程 组 、 控 制 终端 和 会 话 等 概念 的 关系 。 
为 此 ， 再 次 使 用 ps 命令 。 
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首先 使 用 不 支持 作业 控制 的 、 在 Solaris 上 运行 的 经 典 Bourne shell。 如 果 执 行 : 
ps -o pid,ppid,pgid,sid, comm 


则 其 输出 可 能 是 : 


PID PPID PGID SID COMMAND 
949 947 949 949 sh 
1774 949 949 949 ps 


ps 的 父 进程 是 shell, 这 正 是 我 们 所 期 望 的 .shel 和 ps 命令 两 者 位 于 同一 会 话 和 前 台 进 程 组 (949》 
中 。 因 为 我 们 是 用 一 个 不 支持 作业 控制 的 shell 执行 命令 时 得 到 该 值 的 ， 所 以 称 其 为 前 台 进 程 组 。 


| 某 些 平台 支持 一 个 选项 ， 它 使 ps(1) 命 令 打印 与 会 话 控制 终端 相关 联 的 进程 组 ID。 该 值 在 
| TPGID 列 中 显示 。 遗 婴 的 是 ，ps(1) 命 令 的 输出 在 各 个 UNIX 版 本 中 都 有 所 不 同 。 例 如 ，Solaris 10 
: 不 支持 该 选项 。 在 FreeBSD 8.0、Linux 3.2.0 和 Mac OS X 10.6.8 中 ,命令 


| 
| 
| ps -o pid, ppid, pgid, sid, tpgid, comm 
| 


| 准确 地 打印 我 们 想 要 的 信息 。 

”注意 , 将 进程 与 终端 进程 组 ID (TPGID 列 ) 关联 起 来 有 点 用 词 不 当 。 进 程 并 没有 终端 进程 控制 组 。 
进程 属于 一 个 进程 组 ， 而 进程 组 属于 一 个 会 话 。 会 话 可 能 有 也 可 能 没有 控制 终端 。 如 果 它 确实 有 
一 个 控制 终端 ， 则 此 终端 设备 知道 其 前 台 进 程 的 进程 组 DD。 这 一 值 可 以 用 tcsetpgrp 函数 在 终 
端 驱动 程序 中 设置 ( 见 图 9-9), 316 304248 ID 是 终端 的 一 个 属性 ， 而 不 是 进程 的 属性 。 取 自 终端 
设备 驱动 程序 的 该 值 是 ps 在 TPGID 列 中 打印 的 值 。 如 果 ps 发 现 此 会 话 没 有 控制 终端 ， 则 它 在 
该 列 打 印 0 或 者 -1， 具 体 值 因 不 同 平台 而 异 。 


如 果 在 后 台 执 行 命令 : 
ps -o pid,ppid,pgid,sid,comm & 
则 唯一 改变 的 值 是 命令 的 进程 ID: 


PID PPID PGID SID COMMAND 
949 947 949 949 sh 


—— — P ——— 


1812 949 949 949 ps 
因为 这 种 shell 不 知道 作业 控制 , 所 以 没有 将 后 台 作 业 放 入 自己 的 进程 组 , 也 没有 从 后 台 作 业 处 取 
走 控 制 终端 。 


现在 看 一 看 Bourne shell 如 何 处 理 管道 。 执 行 下 列 命 令 : 
ps -o pid,ppid,pgid,sid,comm | catl 


其 输出 是 : 


PID PPID PGID SID COMMAND 
949 947 949 949 sh 

18233 949 949 949 cati 
1824 1823 949 949 ps 


(程序 catl 是 标准 cat 程序 的 一 个 副本 , 只 是 名 字 不 同 。 本 节 还 将 使 用 cat 的 另 一 个 名 为 cat2 
的 副本 。 在 一 个 管道 中 使 用 两 个 cat 副本 时 ， 不 同 的 名 字 可 使 我 们 将 它们 区 分 开 来 .) 注意 ， 管 道 
中 的 最 后 一 个 进程 是 shell 的 子 进 程 ， 该 管道 中 的 第 一 个 进程 则 是 最 后 一 个 进程 的 子 进 程 。 从 中 可 
以 看 出 ，shell fork 一 个 它 自身 的 副本 ， 然 后 此 副本 再 为 管道 中 的 每 条 命令 各 fork 一 个 进程 。 
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如 果 在 后 台 执行 此 管道 ; 
ps -o pid,ppid,pgid,sid,comm | catl & 


则 只 改变 进程 了。 因为 shell 并 不 处 理 作业 控制 ， 后 台 进 程 的 进程 组 ID 仍 是 949， 如 同 会 话 的 进 
FH ID 一 样 。 
如 果 一 个 后 台 进 程 试图 读 其 控制 终端 ， 则 会 发 生 什 么 呢 ? 例如 ， 若 执行 : 


cat > temp.foo & 


在 有 作业 控制 时 ， 后 台 作 业 被 放 在 后 台 进 程 组 ， 如 果 后 台 作 业 试 图 读 控 制 终端 ， 则 会 产生 信和 号 
SIGTTIN。 在 没有 作业 控制 时 ， 其 处 理 方法 是 : 如 果 该 进程 自己 没有 重 定向 标准 输入 ， 则 shell 
自动 将 后 台 进 程 的 标准 输入 重 定向 到 /dev/null。 读 /dev/null 则 产生 一 个 文件 结束 。 这 就 意 
味 着 后 台 cat 进程 立即 读 到 文件 尾 ， 并 正常 终止 。 

前 面 说 明了 对 后 台 进 程 通过 其 标准 输入 访问 控制 终端 的 适当 的 处 理 方法 ， 但 是 ， 如 果 一 个 后 
台 进 程 打开 /dev/tty 并 且 读 该 控制 终端 ， 又 将 怎样 呢 ? 对 此 问题 的 回答 是 “看 情况 ”。 但 是 这 
很 可 能 不 是 我 们 所 期 望 的 。 例 如 


crypt < salaries | lpr & 


就 是 这 样 的 一 条 管道 。 我 们 在 后 台 运行 它 ， 但 是 crypt 程序 打开 /daev/tty， 更 改 终端 的 特性 〈 禁 
止 回 显 )， 然 后 从 该 设备 读 ， 最 后 重 置 该 终端 特性 。 当 执行 这 条 后 台 管 道 时 ，crypt 在 终端 上 打印 提 
AR “Password: ” 但 是 shell 读 取 了 我 们 所 输入 的 加 密 口 令 ， 并 试图 执行 以 加 密 口令 为 名 称 的 命 
令 。 我 们 输送 给 shell 的 下 一 行 则 被 crypt 进程 取 为 口令 行 ， 于 是 salaries 也 就 不 能 正确 地 被 译 
码 ， 结 果 将 一 堆 无 用 的 信息 送 到 了 打印 机 。 在 这 里 ,我 们 有 了 两 个 进程 ， 它 们 试图 同时 读 同 一 设备 ， 
其 结果 则 依赖 于 系统 。 前 面 说 明 的 作业 控制 以 较 好 的 方式 处 理 一 个 终端 在 多 个 进程 间 的 转 接 。 

返回 到 Bourne shell 实例 ， 在 一 条 管道 中 执行 3 个 进程 ， 我 们 可 以 检验 Bourne shell 使 用 的 进 
程控 制 方式 : 


ps -o pid,ppid,pgid,sid,comm | catl | cat2 
其 输出 为 : 


PID PPID PGID SID COMMAND 
949 947 949 949 sh 
1988 949 949 2949 cat2 
1989 1988 949 2949 ps 
1990 1988 949 949 catl 


如 果 在 你 的 系统 上 ， 输 出 的 命令 名 不 正确 ， 那 也 不 必 为 此 感到 惊慌 。 有 时 可 能 会 得 到 类 似 如 
| 下 的 输出 : 

PID PPID PGID SID COMMAND 

949 947 949 949 sh 

1831 949 949 949 sh 


1832 1831 949 949 ps 
1833 1831 949 949 sh 


| 造成 此 种 结果 的 原因 是 ，ps 进程 与 shel 产生 竞争 条 件 ，sheil 创建 一 个 子 进程 并 由 它 执行 cat 命 
' 今 。 在 这 种 情况 下 ， 当 ps 已 经 获得 进程 列表 并 打印 时 ，shell 尚未 完成 exec 调用 。 


再 重申 一 遍 , 该 管道 中 的 最 后 一 个 进程 是 shell 的 子 进程 , 而 执行 管道 中 其 他 命令 的 进程 则 是 
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该 最 后 进程 的 子 进程 。 图 9-10 显示 了 所 发 生 的 情况 。 因 为 该 管道 线 中 的 最 后 一 个 进程 是 登录 shell 
的 子 进程 ， 当 该 进程 (cat2) 终止 时 ，shell 得 到 通知 。 
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9-10 Bourne shell 执行 管道 ps | cat1|cat2 时 的 进程 
现在 让 我 们 用 一 个 运行 在 Linux 上 的 作业 控制 shell 来 检验 同一 个 例子 。 这 将 显示 这 些 shell 
处 理 后 台 作 业 的 方法 。 在 本 例 中 将 使 用 Bourne-again shell， 用 其 他 作业 控制 shell 得 到 的 结果 几乎 
是 一 样 的 。 
ps -o pid,ppid,pgid,sid,tpgid, comm 
其 输出 为 : 


PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 5796 bash 
5796 2837 5796 2837 5796 ps 


(从 本 例 开 始 ， 以 粗 体 显 示 前 台 进 程 组 。) 我 们 立即 看 到 了 与 Bourne shell 例子 的 区 别 。Bourne-again 
shell 将 前 台 作 业 (ps) 放 入 了 它 自己 的 进程 组 (57960. ps 命令 是 进程 组 组 长 进程 ， 也 是 该 进程 
组 的 唯一 进程 。 进 一 步 而 言 ， 此 进程 组 具有 控制 终端 ， 所 以 它 是 前 台 进 程 组 。 我 们 的 登录 shell 
在 执行 Ps 命令 时 是 后 台 进 程 组 。 但 需要 注意 的 是 ， 这 两 个 进程 组 2837 和 5796 都 是 同一 会 话 的 
成 员 。 事 实 上 ， 在 本 节 的 各 实例 中 ， 会 话 决 不 会 改变 。 

在 后 台 执 行 此 进程 : 


ps -o pid,ppid,pgid,sid,tpgid,comm & 


其 输出 为 : 


PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 2837 bash 
5797 2837 5797 2837 2837 ps 


再 一 次 ，ps 命令 被 放 入 它 自 己 的 进程 组 ,但 是 此 时 进程 组 (5797) 不 再 是 前 台 进 程 组 ， 而 是 一 个 
后 台 进 程 组 。TPGID 2837 指示 前 台 进程 组 是 登录 shell. 

按 下 列 方式 在 一 个 管道 中 执行 两 个 进程 : 

ps -o pid,ppid,pgid,sid,tpgid,comm | cati 


其 输出 为 : 


Ww 
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PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 5799 bash 
5799 2837 5799 2837 5799 ps 
5800 2837 5799 2837 5799 catl 


两 个 进程 ps 和 cati 都 在 一 个 新 进程 组 (3799 ) 中 , 这 是 一 个 前 台 进 程 组 。 在 本 例 和 类 似 的 Bourne 
shell 实例 之 间 能 看 到 另 一 个 区 别 。Bourne shell 首先 创建 将 执行 管道 中 最 后 一 条 命令 的 进程 ， 而 
此 进程 是 第 一 个 进程 的 父 进程 。 在 这 里 ，Bourne-again shell 是 两 个 进程 的 父 进程 。 但 是 ， 如 果 在 


后 台 执行 此 管道 : 


ps -o pid,ppid,pgid,sid,tpgid,comm | catl & 


其 结果 是 类 似 的 ， 但 是 ps 和 caci 现在 都 处 于 同一 后 台 进 程 组 。 


PID PPID PGID SID TPGID COMMAND 
2837 2818 2837 2837 2837 bash 
5801 2837 5801 2837 2837 ps 
5802 2837 5801 2837 2837 catl 


注意 ， 使 用 的 shell 不 同 ， 创 建 各 个 进程 的 顺序 也 可 能 不 同 。 


9.10 ”孤儿 进程 组 


我 们 曾 提 及 ， 一 个 其 父 进程 已 终止 的 进程 称 为 孤儿 进程 Corphan process)， 这 种 进程 由 init 
进程 “收养 "”。 现 在 我 们 要 说 明 整 个 进程 组 也 可 成 为 “孤儿 ”， 以 及 POSIX.1 如 何 处 理 它 。 


KB 


考虑 一 个 进程 , 它 fork 了 一 个 子 进程 然后 终止 。 这 在 系 
统 中 是 经 常 发 生 的 ， 并 无 异常 之 处 ， 但 是 在 父 进程 终止 时 ， 
如 果 该 子 进程 停止 《用 作业 控制 ) 又 将 如 何 呢 ? 子 进程 如 何 
继续 ， 以 及 子 进程 是 否 知道 它 已 经 是 孤儿 进程 ? 图 9-11 显示 
了 这 种 情形 ， 父 进程 已 经 fork 了 子 进程 ,该 子 进程 停止 , € 
进程 则 将 退出 。 

构成 此 种 情形 的 程序 示 于 图 9-12 中 。 下 面 要 说 明 该 程序 
的 某 些 新 特性 。 这 里 ， 假 定 使 用 了 一 个 作业 控制 shell. 回忆 
前 面 所 述 ，shell 将 前 台 进 程 放 在 它 〈 指 前 台 进 程 ) 自己 的 进 

程 组 中 (本 例 中 是 6099), shell 则 留 在 自己 的 进程 组 内 (2837)。 

子 进 程 继承 其 父 进程 〈6099) 的 进程 组 。 在 fork 之 后 : 
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e 父 进 程 睡眠 5 秒 ， 这 是 一 种 让 子 进程 在 父 进程 终止 之 ”图 9-11 HERALA RAKA 


前 运行 的 一 种 权宜 之 计 。 


e 子 进程 为 挂 断 信号 (SIGHUP) 建立 信号 处 理 程序 。 这 样 就 能 观察 到 SIGHUP 信和 号 是 否 已 


发 送 给 子 进程 。( 第 10 章 将 讨论 信和 号 处 理 程序 。) 


e 子 进程 用 kill 函数 向 其 自身 发 送 停 止 信号 (STIGTSTP)。 这 将 停止 子 进程 ,类似 于 用 终 


端 挂 起 字符 (Crt) 停止 一 个 前 台 作 业 。 


e 当 父 进程 终止 时 ， 该 子 进程 成 为 孤儿 进程 ， 所 以 其 父 进程 DD 成 为 1， 也 就 是 init 进程 ID。 
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。 现在 ， 子 进程 成 为 一 个 孤儿 进程 组 的 成 员 。POSIX.1 将 孤儿 进程 组 Corphaned process group) 


定义 为 : 该 组 中 每 个 成 员 的 父 进 程 要 么 是 该 组 的 一 个 成 员 ， 要 么 不 是 该 组 所 属 会 话 的 成 
员 。 对 孤儿 进程 组 的 另 一 种 描述 可 以 是 一 个 进程 组 不 是 孤儿 进程 组 的 条 件 是 一 一 该 组 
中 有 一 个 进程 ， 其 父 进 程 在 属于 同一 会 话 的 另 一 个 组 中 。 如 果 进 程 组 不 是 孤儿 进程 组 ， 

那么 在 属于 同一 会 话 的 另 一 个 组 中 的 父 进程 就 有 机 会 重新 启动 该 组 中 停止 的 进程 。 在 这 
里 ， 进 程 组 中 每 一 个 进程 的 父 进 程 〈 例 如 ， 进 程 6100 的 父 进程 是 进程 1) 都 属于 另 一 个 
Sik. Aree ZA EG LUA 

因为 在 父 进程 终止 后 ， 进 程 组 包含 一 个 停止 的 进程 ， 进 程 组 成 为 孤儿 进程 组 ，POSIX.1 
要 求 向 新 孤儿 进程 组 中 处 于 停止 状态 的 每 一 个 进程 发 送 挂 断 信号 (SIGHUP)， 接 着 又 向 
其 发 送 继续 信号 (SIGCONT)。 

在 处 理 了 挂 断 信号 后 ， 子 进程 继续 。 对 挂 断 信和 号 的 系统 默认 动作 是 终止 该 进程 ， 为 此 必 
须 提供 一 个 信号 处 理 程序 以 捕捉 该 信号 。 因 此 ， 我 们 期 望 sig_hup 函数 中 的 printf 会 
在 pr_ids 函数 中 的 printf 之 前 执行 。 


#include "apue.h" 
#include <errno.h> 


static void 
sig_hup{int signo) 


{ 


} 


printf ("SIGHUP received, pid = $1dMn", (long) getpid()); 


static void 
pr_ids(char *name) 


{ 


} 


int 


printf ("%s: pid = $1d, ppid = $1d, pgrp = $1d, tpgrp = %ld\n", 


name, (long)getpid(), (long)getppid(), (long)getpgrp(), 
(long)tcegetpgrp(STDIN FILENO)); 


fflush(stdout); 


main (void) 


{ 


char C; 
pid t pid; 


pr ids ("parent"); 
if ((pid = fork()) < 0) { 


err sys("fork error"); 


} else if (pid > 0) { /* parent */ 


sleep(5); /* sleep to let child stop itself */ 


) else ( /* child */ 


pr ids ("child"); 
signal(SIGHUP, sig hup);  /* establish signal handler */ 
kill(getpid(), SIGTSTP);  /* stop ourself */ 
pr ids("child"); /* prints only if we're continued */ 
if (read(STDIN FILENO, &c, 1) !- 1) 

printf("read error $d on controlling TTY\n", errno); 
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) 
exit (0); 


图 9-12 创建 一 个 孤儿 进程 组 
下 面 是 图 9-12 中 的 程序 的 输出 : 


$ ./a.out 

parent: pid - 6099, ppid - 2837, pgrp - 6099, tpgrp - 6099 
child: pid = 6100, ppid = 6099, pgrp = 6099, tpgrp = 6099 
$ SIGHUP received, pid - 6100 

child: pid - 6100, ppid - 1, pgrp - 6099, tpgrp - 2837 
read error 5 on controlling TTY 


注意 ， 因 为 两 个 进程 ， 登 录 shell 和 子 进 程 都 写 向 终端 ， 所 以 shell 提示 符 和 子 进程 的 输出 一 
起 出 现 。 正 如 我 们 所 期 望 的 那样 ， 子 进程 的 父 进程 ID 变 成 1。 

在 子 进程 中 调用 pr_ids 后 ， 程 序 企图 读 标准 输入 。 如 前 所 述 ， 当 后 台 进 程 组 试图 读 控制 终 
端 时 ， 对 该 后 台 进程 组 产生 STGTTIN。 但 在 这 里 ， 这 是 一 个 孤儿 进程 组 ， 如 果 内 核 用 此 信号 停止 
它 , 则 此 进程 组 中 的 进程 就 再 也 不 会 继续 。POSIX.1 规定 , read 返回 出 错 , 其 errno REA EIO 
(在 本 书 所 用 的 系统 中 其 值 是 5)。 

最 后 ， 要 注意 的 是 父 进程 终止 时 ， 子 进程 变 成 后 台 进程 组 ， 因 为 父 进程 是 由 shell 作为 前 台 作 


业 执行 的 。 s 
309| — 在 19.5 节 的 pty 程序 中 将 会 看 到 孤儿 进程 组 的 另 一 个 例子 。 
9.11 FreeBSD 实现 


前 面 说 明了 进程 、 进 程 组 、 会 话 和 控制 终端 的 各 种 属性 ， 值 得 观察 一 下 所 有 这 些 是 如 何 实现 
的 。 下 面 简要 说 明 FreeBSD 中 的 实现 。SVR4 实现 的 某 些 详细 情况 则 请 参阅 Williams[1989]. 
9-13 显示 了 FreeBSD 使 用 的 各 种 有 关 数 据 结构 。 
下 面 从 session 结构 开始 说 明 图 中 标 出 的 各 个 字段 。 每 个 会 话 都 分 配 一 个 session 结 构 ( 例 
如 ， 每 次 调用 setsid 时 )。 
310 e s count 是 该 会 话 中 的 进程 组 数 。 当 此 计数 器 减 至 0 时 ， 则 可 释放 此 结构 。 
e s leader 是 指向 会 话 首 进程 proc 结构 的 指针 。 
e s ttyvp 是 指向 控制 终端 vnode 结构 的 指针 。 
e s ttyp 是 指向 控制 终端 tty 结构 的 指针 。 
e s_sid 是 会 话 ID。 请 记 住 会 话 ID 这 一 概念 并 非 Single UNIX Specification 的 组 成 部 分 。 
在 调用 setsid 时 , 在 内 核 中 分 配 一 个 新 的 session 结构 。s_count RHA 1, s leader 
设置 为 调用 进程 proc 结构 的 指针 ，s_sid 设置 为 进程 ID， 因 为 新 会 话 没 有 控制 终端 ， 所 以 
s ttyvp M s ttyp 设置 为 空 指针 。 
接着 说 明 tty 结构 。 每 个 终端 设备 和 每 个 伪 终 端 设备 均 在 内 核 中 分 配 这 样 一 种 结构 〈 第 19 
章 将 对 伪 终 端 做 更 多 说 明 )。 
e t_session 指 向 将 此 终端 作为 控制 终端 的 session 结构 (注意 , tty 结构 指向 session 
£M), session 结构 也 指向 tty 结构 )。 终 端 在 失去 载波 信号 时 使 用 此 指针 将 挂 起 信号 
发 送 给 会 话 首 进 程 ( 见 图 9-7)。 
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session 结构 













t pgrp 







vnode 结构 












proc 结构 


grp 


图 9-13 会话 和 进程 组 的 FreeBSD 实现 

e t pgrp 指向 前 台 进 程 组 的 pgrp 结构 。 终 端 驱 动 程序 用 此 字段 将 信和 号 发 送 给 前 台 进 程 组 。 
由 输入 特殊 字符 〈 中 断 、 退 出 和 挂 起 ) 而 产生 的 3 个 信号 被 发 送 至 前 台 进 程 组 。 

e t termios 是 包含 所 有 这 些 特 殊 字 符 和 与 该 终端 有 关 信 息 〈 如 波 特 率 、 回 显 打 开 或 关闭 
等 ) 的 结构 。 第 18 章 将 再 说 明 此 结构 。 

e t winsize 是 包含 终端 窗口 当前 大 小 的 winsize 型 结构 。 当 终端 窗口 大 小 改变 时 ， 信 
号 SIGWINCH 被 发 送 至 前 台 进 程 组 。18.12 节 将 说 明 如 何 设置 和 获取 终端 当前 窗口 大 小 。 

为 了 找到 特定 会 话 的 前 台 进 程 组 ， 内 核 从 session 结构 开始 ， 然 后 用 s_ttyp 得 到 控制 终 

端的 tty 结构 ， 再 用 t_porp 得 到 前 台 进 程 组 的 pgrp 结构 。 

pgrp 结构 包含 一 个 特定 进程 组 的 信息 。 其 中 各 相关 字段 具体 如 下 。 

e pg id 是 进程 组 ID. 

e pg session 指向 此 进程 组 所 属 会 话 的 session 结构 。 

。 pg members 是 指向 此 进程 组 proc 结构 表 的 指针 ， 该 proc 结构 代表 进程 组 的 成 员 。 
proc 结构 中 p pglist 结构 是 双向 链表 , 指向 该 组 中 的 下 一 个 进程 和 上 一 个 进程 。 直到 
遇 到 进程 组 中 的 最 后 一 个 进程 ， 它 的 proc 结构 中 p_pglist 结构 为 空 指针 。 

proc 结构 包含 一 个 进程 的 所 有 信息 。 

。 p pid 包含 进程 ID. 
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e p pptr 是 指向 父 进程 proc 结构 的 指针 。 

e p pgrp 指向 本 进程 所 属 的 进程 组 的 pgrp 结构 的 指针 。 

e p_pglist 是 一 个 结构 ， 其 中 包含 两 个 指针 ， 分 别 指向 进程 组 中 上 一 个 和 下 一 个 进程 。 

最 后 还 有 一 个 vnode 结构 。 如 前 所 述 , 在 打开 控制 终端 设备 时 分 配 此 结构 .进程 对 /dev/tty 
的 所 有 访问 都 通过 vnode 结构 。 


9.12 小 结 


本 章 说 明了 进程 组 之 间 的 关系 一 一 会 话 , 它 由 若干 个 进程 组 组 成 。 作 业 控 制 是 当今 很 多 UNIX 
系统 所 支持 的 功能 ,本 章 说 明了 它 是 如 何 由 支持 作业 控制 的 shell 实现 的 。 在 这 些 进程 关系 中 也 涉 
及 了 进程 的 控制 终端 /dev/tty。 

所 有 这 些 进程 的 关系 都 使 用 了 很 多 信号 方面 的 功能 .下 一 章 将 详细 讨论 UNIX 中 的 信号 机 制 。 


习题 


9.1 考虑 6.8 节 中 说 明 的 utmp 和 wtmp 文件 ， 为 什么 logout 记录 是 由 init 进程 写 的 ? 对 于 
网 络 登录 的 处 理 与 此 相同 吗 ? 

9.2 ”编写 一 段 程 序 调 用 fork 并 使 子 进程 建立 一 个 新 的 会 话 。 验 证 子 进 程 变 成 了 进程 组 组 长 且 不 
再 有 控制 终端 。 








10.1 引言 


信号 是 软件 中 新。 很 多 比较 重要 的 应 用 程序 都 需 处 理 信号 。 信 和 号 提供 了 一 种 处 理 异 步 事件 的 
方法 ， 例 如 ， 终 端 用 户 键入 中 断 键 ， 会 通过 信和 号 机 制 停止 一 个 程序 ， 或 及 早 终 止 管 道中 的 下 一 个 
程序 。 

UNIX 系统 的 早期 版 本 就 已 经 提供 信和 号 机 制 ， 但 是 这 些 系统 (如 V7) 所 提供 的 信号 模型 并 不 
可 靠 。 信 号 可 能 丢失 ， 而 且 在 执行 临界 区 代码 时 ， 进 程 很 难关 闭 所 选择 的 信号 。4.3BSD 和 SVR3 
对 信号 模型 都 做 了 更 改 ， 增 加 了 可 靠 信 号 机 制 。 但 是 Berkeley 和 AT&T 所 做 的 更 改 之 间 并 不 兼容 。 
幸运 的 是 ，POSIX.1 对 可 靠 信 号 例 程 进行 了 标准 化 ， 这 正 是 本 章 所 要 说 明 的 。 

本 章 先 对 信和 号 机 制 进行 综述 ， 并 说 明 每 种 信号 的 一 般 用 法 。 然 后 分 析 早 期 实现 的 问题 。 在 分 
析 存 在 的 问题 之 后 再 说 明 解 决 这 些 问题 的 方法 ， 这 种 安排 有 助 于 加 深 对 改进 机 制 的 理解 。 本 章 也 
包含 了 很 多 并 非 完全 正确 的 实例 ， 这 样 做 的 目的 是 为 了 对 其 不 足 之 处 进行 讨论 。 


10.2 信号 概念 
首先 ， 每 个 信号 都 有 一 个 名 字 。 这 些 名 字 都 以 3 个 字符 SIG 开头 。 例 如 ，SIGABRT 是 天 折 


信号 ， 当 进程 调用 abort 琐 数 时 产生 这 种 信号 ，SIGALRM 是 闹钟 信号 ， 由 alarm 函数 设置 的 定 
时 器 超时 后 将 产生 此 信号 。V7 有 15 种 不 同 的 信号 ，SVR4 和 4.4BSD 均 有 31 种 不 同 的 信号。 


FreeBSD 8.0 支持 32 种 信号 ，Mac OS X 10.6.8 以 及 Linux 3.2.0 都 支持 31 种 信号 ， 而 Solaris 10 


支持 40 种 信号 。 但 是 ，FreeBSD、Linux 和 Solaris 作为 实时 扩展 都 支持 另外 的 应 用 程序 定义 的 信 
号 。 虽 然 本 书 不 包括 POSIX 实时 扩展 (有 关 信 息 请 参阅 Gallmeister[1995]), (A SUSv4 已 经 把 
实时 信号 接口 移 至 基础 规范 说 明 中 。 
在 头 文件 <signal .h> 中 ， 信 和 号 名 都 被 定义 为 正 整数 常量 〈 信 和 号 编号 )。 
(00 实际 上 ， 实 现 将 各 信号 定义 在 另 一 个 头 文件 中 ， 但 是 该 头 文件 又 包括 在 <signal.h> 中 。 内 核 包 
， 括 对 用 户 级 应 用 程序 有 意义 的 头 文件 ， 这 被 认为 是 一 种 不 好 的 形式 ， 所 以 如 若 应 用 程序 和 内 核 两 者 都 
， 需 使 用 同一 定义 ， 那 么 就 将 有 关 信 息 放 置 在 内 核 头 文件 中 ， 然 后 用 户 级 头 文件 再 包括 该 内 核 头 文件 。 
i TX, FreeBSD 8.0 和 Mac OS X 10.6.8 3442-5 X SLE «sys/signal.h»' T, Linux 3.2.0 将 信号 定义 在 


| <bits/signum.h> 中 ，Solaris 10 将 信号 定义 在 <sys/iso/signal_iso.h> 中 。 


不 存在 编号 为 0 的 信和 号。 在 10.9 节 中 将 会 看 到 ，kiI1 函数 对 信号 编号 0 有 特殊 的 应 用 。 
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POSIX.1 将 此 种 信号 编号 值 称 为 空 信号 。 

很 多 条 件 可 以 产生 信和 号 。 

© 当 用 户 按 某 些 终端 键 时 ， 引 发 终端 产生 的 信号 。 在 终端 上 按 Delete 键 ( 或 者 很 多 系统 中 
的 Ctrl+C 键 ) 通常 产生 中 断 信号 (SIGINT)。 这 是 停止 一 个 已 失去 控制 程序 的 方法 。( 第 
18 章 将 说 明 此 信和 号 可 被 映射 为 终端 上 的 任 一 字符 。) 

。 硬件 异常 产生 信号 : 除数 为 0、 无 效 的 内 存 引 用 等 。 这 些 条 件 通常 由 硬件 检测 到 ， 并 通知 
内 核 。 然 后 内 核 为 该 条 件 发 生 时 正在 运行 的 进程 产生 适当 的 信号 。 例 如 ， 对 执行 一 个 无 
效 内 存 引用 的 进程 产生 SIGSEGV 信号 。 

。 进程 调用 kil1(2) 函 数 可 将 任意 信和 号 发 送 给 另 一 个 进程 或 进程 组 。 自 然 ， 对 此 有 所 限制 : 
接收 信号 进程 和 发 送信 号 进程 的 所 有 者 必须 相同 ， 或 发 送信 号 进程 的 所 有 者 必须 是 超级 
FAR. 

© 用 户 可 用 ki11(1) 命 令 将 信和 号 发 送 给 其 他 进程 。 此 命令 只 是 kill 函数 的 接口 。 常 用 此 命 
令 终 止 一 个 失控 的 后 台 进 程 。 

e 当 检 测 到 某 种 软件 条 件 已 经 发 生 ， 并 应 将 其 通知 有 关 进 程 时 也 产生 信号 。 这 里 指 的 不 是 
硬件 产生 条 件 〈 如 除 以 0)， 而 是 软件 条 件 。 例 如 SIGURG 〈 在 网 络 连接 上 传 来 带 外 的 数 
据 )、SIGPIPE (在 管道 的 读 进 程 已 终止 后 ， 一 个 进程 写 此 管道 ) 以 及 SIGALRM (进程 
所 设置 的 定时 器 已 经 超时 )。 

信号 是 异步 事件 的 经 典 实例 。 产 生 信 和 号 的 事件 对 进程 而 言 是 随机 出 现 的 。 进 程 不 能 简单 地 测 
试 一 个 变量 (如 errno) 来 判断 是 否 发 生 了 一 个 信号 ， 而 是 必须 告诉 肉 核 “在 此 信和 号 发 生 时 ， 请 

执行 下 列 操作 ”。 

在 某 个 信和 号 出 现时 ， 可 以 告诉 内 核 按 下 列 3 种 方式 之 一 进行 处 理 ， 我 们 称 之 为 信号 的 处 理 或 
与 信号 相关 的 动作 。 

(1) 忽略 此 信号 。 大 多数 信号 都 可 使 用 这 种 方式 进行 处 理 ， 但 有 两 种 信和 号 却 决 不 能 被 忽略 。 
它们 是 SIGKILL 和 SIGSTOP。 这 两 种 信号 不 能 被 忽略 的 原因 是 : 它们 向 内 核 和 超级 用 户 提供 了 
使 进程 终止 或 停止 的 可 靠 方法 。 另 外 ， 如 果 忽 略 某 些 由 硬件 异常 产生 的 信号 〈 如 非法 内 存 引用 或 
除 以 0)， 则 进程 的 运行 行为 是 未 定义 的 。 

(2) 捕捉 信号 。 为 了 做 到 这 一 点 ， 要 通知 内 核 在 某 种 信号 发 生 时 ， 调 用 一 个 用 户 函 数 。 在 用 
户 函 数 中 ， 可 执行 用 户 希望 对 这 种 事件 进行 的 处 理 。 例 如 ， 若 正在 编写 一 个 命令 解释 器 ， 它 将 用 
户 的 输入 解释 为 命令 并 执行 之 ， 当 用 户 用 键盘 产生 中 断 信号 时 ， 很 可 能 希望 该 命令 解释 器 返回 到 
主 循环 ， 终 止 正在 为 该 用 户 执 行 的 命令 。 如 果 捕 提 到 SIGCHLD 信号， 则 表示 一 个 子 进 程 已 经 终 
止 ， 所 以 此 信和 号 的 捕 提 函数 可 以 调用 waitpid 以 取得 该 子 进程 的 进程 ID 以 及 它 的 终止 状态 。 又 
例如 ， 如 果 进 程 创建 了 临时 文件 ， 那 么 可 能 要 为 SIGTERM 信和 号 编写 一 个 信和 号 捕捉 函数 以 清除 临 
时 文件 (SIGTERM 是 终止 信号 ，ki11 命令 传送 的 系统 默认 信和 号 是 终止 信号 )。 注 意 ， 不 能 捕 损 
SIGKILL 和 SIGSTOP 信和 号 。 

(3) 执行 系统 默认 动作 。 图 10-1 给 出 了 对 每 一 种 信号 的 系统 默认 动作 。 注 意 ， 对 大 多 数 信和 号 
的 系统 默认 动作 是 终止 该 进程 。 

10-1 列 出 了 所 有 信号 的 名 字 , 说 明了 哪些 系统 支持 此 信和 号 以 及 对 于 这 些 信号 的 系统 默认 动 
作 。 在 SUS 列 中 ,“。” 表 示 此 种 信号 定义 为 基本 POSIX.1 规范 部 分 ,“XSI” 表 示 该 信号 定义 在 
XSI 扩展 部 分 。 

在 系统 默认 动作 列 ,“ 终 止 +fcore” 表 未 在 进程 当前 工作 目录 的 core 文件 中 复制 了 该 进程 的 内 
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存 映像 (该 文件 名 为 core, 由 此 可 以 看 出 这 种 功能 很 久之 前 就 是 UNIX 的 一 部 分 )。 大 多 数 UNIX 
系统 调试 程序 都 使 用 core 文件 检查 进程 终止 时 的 状态 。 


FreeBSD Linux MacOS Solaris 默认 动作 


SIGCANCEL 


SIGCHLD 
SIGCONT 
SIGEMT 
SIGFPE 


SIGFREEZE 


SIGHUP 
SIGILL 
SIGINFO 
SIGINT 
SIGIO 
SIGIOT 
SIGJVMI 
SIGJVM2 
SIGKILL 
SIGLOST 
SIGLWP 
SIGPIPE 
SIGPOLL 
SIGPROF 
SIGPWR 
SIGQUIT 
SIGSEGV 


SIGSTKFLT 


SIGSTOP 
SIGSYS 

SIGTERM 
SIGTHAW 
SIGTHR 

SIGTRAP 
SIGTSTP 
SIGTTIN 
SIGTTOU 
SIGURG 

SIGUSR1 
SIGUSR2 


SIGVTALRM 
SIGWAITING 


SIGWINCH 
SIGXCPU 
SIGXFSZ 
SIGXRES 


异常 终止 labort) 
定时 器 超时 (alarm) 
硬件 故障 

线程 库 内 部 使 用 

子 进程 状态 改变 
使 暂停 进程 继续 
硬件 故障 

算术 异常 
检查 点 冻结 
连接 斯 开 

非法 硬件 指令 

键盘 状态 请 求 
终端 中 斯 符 

异步 IO 

硬件 故障 

Java 虚拟 机 内 部 使 用 
Java 虚拟 机 内 部 使 用 
终止 

资源 丢失 

线程 库 内 部 使 用 

写 至 无 读 进 程 的 管道 
可 轮 询 事件 (poll) 
梗概 时 间 超 时 (setitimer) 


虚拟 时 间 和 闪 钟 (setitimer) 
线程 库 内 部 使 用 

终端 窗口 大 小 改变 

超过 CPU 限制 Csetrlimit) 
超过 文件 长 度 限制 (setrlimit) 
超过 资源 控制 


图 10-1 


* * . . * * * s e 
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320 2X10.6.8 


s . e e . . . . . . 


* . . . . . * * 


10 
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产生 core 文件 是 大 多 数 UNIX 系统 的 实现 功能 。 虽 然 该 功能 不 是 POSIX.1 的 组 成 部 分 ,但 在 
，Single UNIX Specification XSI 的 扩展 部 分 中 ， 这 一 功能 作为 一 个 潜在 的 特定 实现 的 动作 被 提 及 。 
| 在 不 同 的 实现 中 ，core 文件 的 名 字 可 能 不 同 。 例如， 在 FreeBSD 8.0 F, coe 文件 名 为 
l cmdname.core， 其 中 cmdname 是 接收 到 信号 的 进程 所 执行 的 命令 名 。 在 Mac OS X 10.6.8 "P, core 
文件 名 是 corepid, HP, pid 是 接收 到 信号 的 进程 的 ID。( 这 些 系统 允许 经 sysctl 参数 配置 core 
, 文件 名 。 在 Linux 3.2.0 P, core X4 £ifiid /proc/sys/kernel/core pattern 进行 配置 。) 

大 多 数 实现 在 相应 进程 的 工作 目录 中 包含 core 文件 项 ; 12 Mac OS X 将 所 有 core 文件 都 放置 
在 /cores 目录 中 。 


在 下 列 条 件 下 不 产生 core 文件 : (a) 进程 是 设置 用 户 ID 的 ， 而 且 当 前 用 户 并 非 程序 文件 的 
MA: (b) 进程 是 设置 组 ID 的 ， 而 且 当 前 用 户 并 非 该 程序 文件 的 组 所 有 者 ; COO 用 户 没 有 写 当 
前 工作 目录 的 权限 ; (d) 文件 已 存在 ， 而 且 用 户 对 该 文件 设 有 写 权 限 ; Ce) 文件 太 大 《回忆 7.11 节 中 
的 RLIMIT CORE 限制 )。core 文件 的 权限 〈 假 定 该 文件 在 此 之 前 并 不 存在 ) 通常 是 用 户 读 / 写 ， 
但 Mac OS X 只 设置 为 用 户 读 。 

在 图 10-1 说 明 中 的 “硬件 故障 ”对 应 于 实现 定义 的 硬件 故障 。 这 些 名 字 中 有 很 多 取 自 UNIX 系统 
早先 在 PDP-11 上 的 实现 。 请 查看 你 所 使 用 系统 的 手册 ,以 确切 地 弄 清楚 这 些 信号 对 应 于 哪些 错误 类 型 。 

下 面 较 详 细 地 逐一 说 明 这 些 信 号 。 


SIGABRT 
SIGALRM 


SIGBUS 


SIGCANCEL 
SIGCHLD 


SIGCONT 


SIGEMT 


调用 abort 函数 时 〈 见 10.17 节 ) 产生 此 信号。 进程 异常 终止 。 

当 用 alarm 函数 设置 的 定时 器 超时 时 ， 产 生 此 信号 。 详 细 情 况 见 10.10 节 。 
若 由 setitimer(2) 函 数 设置 的 间隔 时 间 已 经 超时 时 ， 也 产生 此 信号。 

指示 一 个 实现 定义 的 硬件 故障 。 当 出 现 某 些 类 型 的 内 存 故 障 时 〈 如 14.8 节 中 
说 明 的 )， 实 现 常 常 产生 此 种 信和 号 。 

这 是 Solaris 线程 库 内 部 使 用 的 信号 。 它 不 适用 于 一 般 应 用 。 

在 一 个 进程 终止 或 停止 时 ，SIGCHLD 信和 号 被 送 给 其 父 进 程 。 按 系统 默认 ， 将 忽 
略 此 信和 号。 如果 父 进程 希望 被 告知 其 子 进 程 的 这 种 状态 改变 ， 则 应 捕 损 此 信和 号 。 
信号 捕捉 函数 中 通常 要 调用 一 -种 wait 函数 以 取得 子 进 程 ID 和 其 终止 状态 。 
System V 的 早期 版 本 有 一 个 名 为 SIGCLD (无 8) 的 类 似 信号 。 这 一 信号 具有 
与 其 他 信和 号 不 同 的 语义 ，SVR2 的 手册 页 警告 在 新 的 程序 中 尽量 不 要 使 用 这 种 
言 号 。( 令 人 奇怪 的 是 ， 在 SVR3 和 SVRA 版 的 手册 页 中 ， 该 警告 消失 了 。) 应 
用 程序 应 当 使 用 标准 的 SIGCHLD 信号 ， 但 应 了 解 ， 为 了 向 后 兼容 ， 很 多 系统 
定义 了 与 SIGCHLD 等 同 的 SIGCLD。 如 果 有 使 用 SIGCLD 的 软件 ， 需 要 查阅 
系统 手册 ， 了 解 它 具体 的 语义 。10.7 节 将 讨论 这 两 个 信和 号。 

此 作业 控制 信号 发 送 给 需要 继续 运行 ， 但 当前 处 于 停止 状态 的 进程 。 如 果 接 
收 到 此 信和 号 的 进程 处 于 停止 状态 ， 则 系统 默认 动作 是 使 该 进程 继续 运行 ， 否 
则 默认 动作 是 忽略 此 信号 。 例 如， 全 屏 编辑 程序 在 捕捉 到 此 信和 号 后 ， 使 用 信 
号 处 理 程 序 发 出 重新 绘制 终端 屏幕 的 通知 。 关 于 进一步 的 情况 见 10.21 节 。 
指示 一 个 实现 定义 的 硬件 故障 。 


EMT iX — £ FR PDP-11 的 仿真 器 陷入 ( emulator trap) 指令 。 并 非 所 有 平台 都 支持 此 


信号。 例如 ，Linux 只 对 SPARC, MIPS 和 PA_RISC 等 系统 结构 支持 SIGEMT。 
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SIGFPE 此 信号 表示 一 个 算术 运算 异常 ， 如 除 以 0、 浮 点 溢出 等 。 

SIGFREEZE 此 信号 仅 由 Solaris 定义 。 它 用 于 通知 进程 在 冻结 系统 状态 之 前 需要 采取 特定 
动作 ， 例 如 当 系 统 进 入 休 眼 或 挂 起 状态 时 可 能 需要 做 这 种 处 理 。 

SIGHUP 如 果 终 端 接口 检测 到 一 个 连接 断 开 ， 则 将 此 信号 送 给 与 该 终端 相关 的 控制 进程 
(会话 首 进程 )。 见 图 9-13， 此 信号 被 送 给 session 结构 中 s leader 字段 所 
指向 的 进程 。 仅 当 终 端的 CLOCAL 标志 没有 设置 时 ， 在 上 述 条 件 下 才 产 生 此 信 
号 。( 如 果 所 连接 的 终端 是 本 地 的 ， 则 设置 该 终端 的 CLOCAL 标志 。 它 告诉 终端 
驱动 程序 忽略 所 有 调制 解 调 器 的 状态 行 。 第 18 章 将 说 明 如 何 设置 此 标志 。) 
注意 ， 接 到 此 信号 的 会 话 首 进程 可 能 在 后 台 ， 作 为 一 个 例子 ， 请 参见 图 9-7。 
这 区 别 于 由 终端 正常 产生 的 几 个 信号 〈 中 断 、 退 出 和 挂 起 )， 这 些 信 和 号 总 是 传 
递 给 前 台 进 程 组 。 
如 果 会 话 首 进程 终止 ， 也 产生 此 信号 。 在 这 种 情况 ， 此 信号 送 给 前 台 进 程 组 
中 的 每 一 个 进程 。 
通常 用 此 信号 通知 守护 进程 ( 见 第 13 章 ) 再 次 读 取 它 们 的 配置 文件 。 选用 SIGHUP 
的 理由 是 ， 守 护 进 程 不 会 有 控制 终端 ， 通 常 决 不 会 接收 到 这 种 信和 号。 

SIGILL 此 信号 表示 进程 已 执行 一 条 非法 硬件 指令 。 


43BSD 的 abort Ba + sees, Di BMF A STGABRT 信号。 


SIGINFO 这 是 一 种 BSD 信号 ， 当 用 户 按 状态 键 ( 一 般 采 用 CoHT) 时 ， 终 端 驱动 程序 
产生 此 信号 并 发 送 至 前 台 进 程 组 中 的 每 一 个 进程 〈 见 图 9-9)。 此 信号 通常 造 
成 在 终端 上 显示 前 台 进 程 组 中 各 进程 的 状态 信息 。 


| RR Alpha 平台 将 SIGINFO 定义 为 与 SIGPWR 具有 相同 值 ， 但 是 Linux 并 不 支持 SIGINFO 
| 信号。 这 更 多 是 因为 需要 对 OSF 开发 的 软件 提供 某 种 程度 的 兼容 。 


SIGINT 当 用 户 按 中 断 键 〈 一 般 采 用 Delete 或 Ctrl+C) 时 ， 终 端 驱动 程序 产生 此 信和 号 
并 发 送 至 前 台 进 程 组 中 的 每 一 个 进程 〈 见 图 9-9)。 当 一 个 进程 在 运行 时 失控 ， 
特别 是 它 正 在 屏幕 上 产生 大 量 不 需要 的 输出 时 ， 常 用 此 信号 终止 它 。 

SIGIO 此 信和 号 指示 一 个 异步 IO 事件 。 在 14.52 节 中 将 对 此 进行 讨论 。 


| 在 图 10-1 中 ,对 SIGIO 的 系统 吐 认 动作 是 终止 或 忽略。 遗憾 的 是 ， 这 依赖 于 系统 。 在 
. System V P, SIGIO 与 SIGPOLL 相同 ， 其 默认 动作 是 终止 此 进程 。 在 BSD 中 ， 其 默认 动 
| 作 是 忽略 此 信号 。 

Linux 3.2.0 和 Solaris 10 将 SIGIO 定义 为 与 SIGPOLL 具有 相同 值 ， 所 以 默认 行为 是 终 
| 止 该 进程 。 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 ， 黑 认 行 为 是 忽略 该 信号 。 


SIGIOT 这 指示 一 个 实现 定义 的 硬件 故障 。 


| IOT 这 个 名 字 来 自 于 PDP-11， 它 是 PDP-11 计算 机 “输入 /输出 TRAP" (input/output TRAP ) 48 
' AME. System V 的 早期 版 本 ， 由 abort BRE SMES, BMI E SIGABRT 信号 。 
FreeBSD 8.0、Linux 3.2.0、Mac OS X 10.6.8 和 Solaris 10 将 SIGIOT 定义 为 与 SIGABRT 
具 相 同 值 。 


SIGJVM1 Solaris 上 为 Java 虚拟 机 预 留 的 一 个 信号 。 
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SIGJVM2 
SIGKILL 


SIGLOST 


SIGLWP 


SIGPIPE 


SIGPOLL 


Solaris 上 为 Java 虚拟 机 预 留 的 另 一 个 信和 号。 

这 是 两 个 不 能 被 捕捉 或 忽略 信号 中 的 一 个 。 它 向 系统 管理 员 提 供 了 一 种 可 以 
杀 死 任 一 进程 的 可 靠 方法 。 

运行 在 Solaris NFSv4 客户 端 系统 中 的 进程 ， 恢 复 阶段 不 能 重新 获得 锁 ， 此 时 
将 由 这 个 信号 通知 该 进程 。 

此 信号 由 Solaris 线程 库 内 部 使 用 , 并 不 做 一 般 使 用 。 在 FreeBSD 中 ，SIGLWP 
是 SIGTHR 的 别名 。 

如 果 在 管道 的 读 进程 已 终止 时 写 管道 ， 则 产生 此 信号 。15.2 节 将 说 明 管 道 。 当 
类 型 为 SOCK_STREAM 的 套 接 字 已 不 再 连接 时 ， 进 程 写 该 套 接 字 也 产生 此 信 
号 。 我 们 将 在 第 16 章 说 明 套 接 字 。 

这 个 信和 号 在 SUSv4 中 已 被 标记 为 弃 用 ， 将 来 的 标准 可 能 会 将 此 信和 号 移 除 。 当 
在 一 个 可 轮 询 设备 上 发 生 一 个 特定 事件 时 产生 此 信和 号。14.4.2 节 将 说 明 poll 
函数 和 此 信号 ， 它 起 源 于 SVR3， 与 BSD 的 SIGIO 和 SIGURG 信和 号 接近 。 


i # Linux 和 Solaris P, SIGPOLL 定义 为 与 SIGIO 具有 相同 值 。 


SIGPROF 


SIGPWR 


这 个 信号 在 SUSv4 中 已 被 标记 为 弃 用 ， 将 来 的 标准 可 能 会 将 此 信和 号 移 除 。 当 
setitimer(2) 函 数 设置 的 梗概 统计 间隔 定时 器 (profiling interval timer) 已 经 
超时 时 产生 此 信和 号 。 

这 是 一 种 依赖 于 系统 的 信号 。 它 主要 用 于 具有 不 间断 电源 CUPS) 的 系统 。 如 
果 电 源 失 效 ， 则 UPS 起 作用 ， 而 且 通 常 软 件 会 接 到 通知 。 在 这 种 情况 下 ， 系 
统 依 靠 蓄电池 电源 继续 运行 ， 所 以 无 须 做 任何 处 理 。 但 是 如 果 蕾 电池 也 将 不 
能 支持 工作 ， 则 软件 通常 会 再 次 接 到 通知 ， 此 时 ， 系 统 必 项 使 其 各 部 分 都 停 
止 运行 。 这 时 应 当 发 送 SIGPWR 信号 。 在 大 多 数 系 统 中 ， 接 到 蓄电池 电压 过 
低 信 息 的 进程 将 信号 SIGPWR RIES init 进程 ,然后 由 init 处 理 停机 操作 。 


Solaris 10 和 有 些 Linux 版 本 在 inittab 文件 中 有 两 个 记录 项 用 于 此 种 目的 : powerfail 
; 以 及 powerwait (或 powerokwait )。 

在 图 10-1 中 ,我 们 将 SIGPWR 的 默认 动作 标记 为 “终止 或 忽略 "。 遗 憾 的 是 ， 这 种 默认 动 
， 作 依赖 于 系统 。Linux 对 此 的 默认 动作 是 终止 相关 进程 ， 而 Solaris 的 默认 动作 是 忽略 该 信号 。 


SIGQUIT 


SIGSEGV 


当 用 户 在 终端 上 按 退 出 键 〈 一 般 采 用 Ctr) Bi, PKB ea Ss. 
并 发 送 给 前 台 进 程 组 中 的 所 有 进程 OLA 9-9)。 此 信和 号 不 仅 终 止 前 台 进 程 组 
(如 SIGINT 所 做 的 那样 )， 同 时 产生 一 个 core 文件 。 

指示 进程 进行 了 一 次 无 效 的 内 存 引 用 (通常 说 明 程 序 有 错 ， 比 如 访问 了 一 个 
未 经 初始 化 的 指针 )。 


名 字 SEGV RA “Hitt” (segmentation violation )。 


SIGSTKFLT 


SIGSTOP 


SIGSYS 


此 信和 号 仅 由 Linux 定义 。 它 出 现在 Linux 的 早期 版 本 ， 企 图 用 于 数学 协 处 理 器 
的 栈 故 障 。 该 信号 并 非 由 内 核 产 生 ， 但 仍 保留 以 向 后 兼容 。 

这 是 一 个 作业 控制 信号 ， 它 停止 一 个 进程 。 它 类 似 于 交互 停止 信号 (SIGTSTP)， 
但 是 SIGSTOP 不 能 被 捕 提 或 忽略 。 

该 信号 指示 一 个 无 效 的 系统 调用 。 由 于 某 种 未 知 原因 ， 进 程 执 行 了 一 条 机 器 
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指令 ， 内 核 认 为 这 是 一 条 系统 调用 ， 但 该 指令 指示 系统 调用 类 型 的 参数 却 是 
无 效 的 。 这 种 情况 是 可 能 发 生 的 ， 例 如 ， 若 用 户 编写 了 一 道 使 用 新 系统 调用 
的 程序 ， 然 后 运行 该 程序 的 二 进 制 可 执行 代码 ， 而 所 用 的 操作 系统 却 是 不 支 
持 该 系统 调用 的 较 早 版 本 ， 于 是 就 出 现 上 述 情况 。 320 

SIGTERM 这 是 由 ki11(1) 命 令 发 送 的 系统 默认 终止 信和 号。 由 于 该 信号 是 由 应 用 程序 捕获 
的 ,使 用 SIGTERM 也 让 程序 有 机 会 在 退出 之 前 做 好 清理 工作 ， 从 而 优雅 地 终 
止 ( 相 对 于 SIGKILL WA. SIGKILL 不 能 被 捕捉 或 者 忽略 )。 

SIGTHAW ”此 信号 仅 由 Solaris 定义 。 在 被 挂 起 的 系统 恢复 时 ， 该 信号 用 于 通知 相关 进程 ， 
它们 需要 采取 特定 的 动作 。 

SIGTHR FreeBSD 线程 库 预 留 的 信号 ， 它 的 值 定义 或 与 SIGLWP 相同 。 

SIGTRAP 指示 一 个 实现 定义 的 硬件 故障 。 


| 此 信号 名 来 自 于 PDP-11 的 TRAP 指令 。 当 执行 断 点 指令 时 ， 实 现 常用 此 信号 将 控制 转 
| 移 至 调试 程序 。 


SIGTSTP 交互 停止 信号 ， 当 用 户 在 终端 上 按 挂 起 键 〈 一 般 采 用 Cub») 时 ， 终 端 驱动 
程序 产生 此 信号 。 该 信号 发 送 至 前 台 进 程 组 中 的 所 有 进程 (参见 图 9-9). 


BHR, 停止 具有 不 同 的 含义 。 当 讨论 作业 控制 和 信号 时 ,我 们 谈 及 停止 和 继续 作业 。 
| 但 是 ， 终端 驱动 程序 一 直 使 用 术语 “停止 ”表示 用 CtritS 字符 终止 终端 输出 ， 为 了 继续 启动 
“该 终 端 输出 , 则 用 CtrlHQ 字符 。 为 此 , 终端 驱动 程序 称 产生 交互 停止 信号 的 字符 为 挂 起 字符 ， 
而 非 停 止 字符 。 


SIGTTIN 当 一 个 后 台 进 程 组 进程 试图 读 其 控制 终端 时 ， 终 端 驱 动 程序 产生 此 信号 〈 见 
9.8 节 中 对 此 问题 的 讨论 )。 在 下 列 例外 情形 下 不 产生 此 信号 :(a) 读 进 程 忽 略 
或 阻塞 此 信号 ，(b) 读 进 程 所 属 的 进程 组 是 孤儿 进程 组 ， 此 时 读 操 作 返 回 出 
i, errno REX EIO. 

SIGTTOU 当 一 个 后 台 进 程 组 进程 试图 写 其 控制 终端 时 ， 终 端 驱 动 程序 产生 此 信号 ( 见 
9.8 节 对 此 问题 的 讨论 )。 与 上 面 所 述 的 SIGTTIN 信号 不 同 , 一 个 进程 可 以 选 
择 允 许 后 台 进 程 写 控制 终端 。 第 18 章 将 讨论 如 何 更 改 此 选项 。 
如 果 不 允 许 后 台 进 程 写 ， 则 与 SIGTTIN 相似 ， 也 有 两 种 特殊 情况 : Ca) "ub 
程 忽略 或 阻塞 此 信和 号; (b) 写 进程 所 属 进程 组 是 孤儿 进程 组 。 在 第 2 种 情况 下 
不 产生 此 信号 ， 写 操作 返回 出 错 ，errno REN EIO. 
不 论 是 否 允 许 后 台 进 程 写 ， 一 些 除 写 以 外 的 下 列 终 端 操 作 也 能 产生 SIGTTOU 
信号 ， 如 tcsetattr、tcsendbreak、tcdrain、 tcflush. tcflow 以 
及 tcsetpgrp。 第 18 章 将 说 明 这 些 终 端 操作 。 

SIGURG 此 信号 通知 进程 已 经 发 生 一 个 紧急 情况 。 在 网 络 连接 上 接 到 带 外 的 数据 时 ， 
可 选择 地 产生 此 信和 号 。 

SIGUSR1 这 是 一 个 用 户 定义 的 信号 ， 可 用 于 应 用 程序 。 

SIGUSR2 这 是 另 一 个 用 户 定义 的 信号 ， 与 SIGUSR1 相似 ， 可 用 于 应 用 程序 。 

SIGVTALRM ” 当 一 个 由 setitimer(2) 函 数 设置 的 虚拟 间隔 时 间 已 经 超时 时 ， 产 生 此 信号 。 

SIGWAITING 此 信号 由 Solaris 线程 库 内 部 使 用 ， 不 做 他 用 。 
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SIGWINCH ”内 核 维持 与 每 个 终端 或 伪 终 端 相关 联 窗口 的 大 小 。 进 程 可 以 用 ioctl BR ( 见 
18.12 节 ) 得 到 或 设置 窗口 的 大 小 。 如 果 进 程 用 ioctl 的 设置 窗口 大 小 命令 
更 改 了 窗口 大 小 ， 则 内 核 将 SIGWINCS 信号 发 送 至 前 台 进 程 组 。 

SIGXCPU Single UNIX Specification 的 XSI 扩展 支持 资源 限制 的 概念 〈( 见 7.11 节 )。 如 果 
进程 超过 了 其 软 CPU 时 间 限 制 ， 则 产生 此 信和 号 。 


在 图 10-1 中 ， 对 于 SIGXCPU 的 默认 动作 说 明 为 “终止 或 终止 +core”。 该 默认 动作 依 闲 
| 于 操作 系统 。Linux 3.2.0 和 Solaris 10 支持 的 默认 动作 是 终止 并 创建 core 文件 ; FreeBSD 8.0 
， 和 Mac OS X 10.6.8 支持 的 默认 动作 是 终止 且 不 产生 core 文件 。Single UNIX Specification 要 
， 求 该 默认 动作 是 ， 异 常 终止 该 进程 ， 是 否 创 建 core 文件 则 留 给 实现 决定 。 


SIGXFSZ 如 果 进 程 超过 了 其 软文 件 长 度 限 制 ( 见 7.11 节 )， 则 产生 此 信和 号 。 


| 如 同 SIGXCPU — 4f, 针对 SIGXFSZ 的 默认 动作 依赖 于 操作 系统 。Linux 3.2.0 和 Solaris 
，10 对 此 信号 的 默认 动作 是 终止 并 创建 core 文件 。FreeBSD 8.0 和 Mac OS X 10.6.8 X ré 9 
” 认 动 作 是 终止 且 不 产生 core 文件 。Single UNIX Specification 要 求 该 默认 动作 是 异常 终止 该 进 
， 程 ， 是 否 创建 core 文件 则 留 给 实现 决定 。 


SIGXRES 此 信号 仅 由 Solaris 定义 。 可 选择 地 使 用 此 信号 以 通知 进程 超过 了 预 配置 的 资源 值 。 
Solaris 资源 限制 机 制 是 一 种 通用 设施 ,用 于 控制 在 独立 应 用 集 之 间 共 享 资 源 的 使 用 。 


10.3 函数 signal 


UNIX 系统 信号 机 制 最 简单 的 接口 是 signal 函数 。 


#include <signal.h> 


f 


void (*signal(int signo, void (*func) (int))) (int); 


返回 值 : 若 成 功 ， 返 回 以 前 的 信号 处 理 配 置 ， 若 出 错 ， 返 回 SIG ERR 





| signal 函数 由 ISO C 定义 。 因 为 1SO C 不 涉及 多 进程 、 进 程 组 以 及 终端 IO 等 ， 所 以 它 对 
| 信号 的 定义 非常 含糊 ， 以 致 于 对 UNIX 系统 而 言 几乎 之 无 用 处 。 

，。 AKUNIX System V 派生 的 实现 支持 signal 函数 ， 但 该 画 数 提供 旧 的 不 可 靠 信号 语义 (10.4 
， 节 将 说 明 这 些 因 的 语义 )。 提供 此 函数 主要 是 为 了 向 后 兼容 要求 此 旧 语 义 的 应 用 程序 ,新 应 用 程序 
: 不 应 使 用 这 些 不 可 靠 信 和 号 。 

i 44BSD 也 提供 signal AK, (eC XE ER sigaction 函数 定义 的 (10.14 节 将 说 明 
| sigaction 函数 )， 所 以 在 44BSD 之 下 使 用 它 提供 新 的 可 靠 信号 语义 。 目 前 大 多 数 系统 坦 循 这 
”种 策略 ， 但 Solaris 10 沿用 System V signal 函数 的 语义 。 

| 因为 signal 的 语义 与 实现 有 关 , 所 以 最 好 使 用 sigaction 函数 代替 signal 函 教 。 在 10.14 
"ibi sigaction 函数 时 ,提供 了 使 用 该 函数 的 signal 的 一 个 实现 。 本 书 中 的 所 有 实例 均 使 
: 用 图 10-18 中 给 出 的 signal 函数 ， 这 样 不 管 使 用 何 种 乎 台 都 可 以 有 一 致 的 语义 。 


signo 参数 是 图 10-1 PRS A. func 的 值 是 常量 SIG_IGN、 常 量 SIG_DFL 或 当 接 到 此 信 


号 后 要 调用 的 函数 的 地 址 。 如 果 指 定 SIG_IGN， 则 向 内 核 表示 忽略 此 信号 〈 记 住 有 两 个 信号 SIGKILL 
和 SIGSTOP 不 能 忽略 )。 如 果 指 定 SIG_DFL, 则 表示 接 到 此 信号 后 的 动作 是 系统 默认 动作 ( 见 图 10-1 
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中 的 最 后 一 列 )。 当 指定 函数 地 址 时 ， 则 在 信和 号 发 生 时 ， 调 用 该 函数 ， 我 们 称 这 种 处 理 为 捕捉 该 信号 ， 
称 此 函数 为 信号 处 理 程序 (signal handler) 或 信号 捕捉 函数 (signal-catching function). 

signal 函数 原型 说 明 此 函数 要 求 两 个 参数 ， 返 回 一 个 函数 指针 ， 而 该 指针 所 指向 的 函数 无 
返回 值 (void)。 第 一 个 参数 signo 是 一 个 整 型 数 ， 第 二 个 参数 是 函数 指针 ， 它 所 指向 的 函数 需 
要 一 个 整 型 参数 ， 无 返回 值 。signal 的 返回 值 是 一 个 函数 地 址 ， 该 函数 有 一 个 整 型 参数 〈 即 最 
后 的 (int) )。 用 上 自然 语言 来 描述 也 就 是 要 向 信和 号 处 理 程 序 传 送 一 个 整 型 参数 ， 而 它 却 无 返回 值 。 
当 调 用 signal 设置 信号 处 理 程序 时 ， 第 二 个 参数 是 指向 该 聊 数 (也 就 是 信号 处 理 程序 ) 的 指针 。 
signal 的 返回 值 则 是 指向 在 此 之 前 的 信号 处 理 程序 的 指针 。 


| 很 多 系统 用 附加 的 依赖 于 实现 的 参 教 来 调 用 信 叶 处 理 程序 。10.14 节 将 对 此 做 进一步 说 明 。 
本 节 开 头 所 示 的 signal 函数 原型 太 复杂 了 ， 如 果 使 用 下 面 的 typedef[Plauger 1992]， 则 
可 使 其 简单 一 些 。 
typedef void Sigfunc(int); [323] 
然后 ， 可 将 signal 函数 原型 写成 : 
Sigfunc *signal(int, Sigfunc *); 


我 们 已 将 此 typedef 包括 在 apue .h 文件 中 ( 见 附录 B)， 并 随 本 章 中 的 通 数 一 起 使 用 。 
如 果 查 看 系统 的 头 文件 <signal .h>， 则 很 可 能 会 找到 下 列 形式 的 声明 : 


#define SIG ERR (void {*)())-1 
#define SIG DFL (void (*)())0 
#define SIG IGN (void (*)40))1 


这 些 常 量 可 用 于 表示 “指向 函数 的 指针 ， 该 函数 要 求 一 个 整 型 参数 ， 而 且 无 返回 值 ”*。signal 的 
第 二 个 参数 及 其 返回 值 就 可 用 它们 表示 。 这 些 常量 所 使 用 的 3 个 值 不 一 定 是 -1、0 和 1， 但 它们 
必须 是 3 个 值 而 决 不 能 是 任 一 函数 的 地 址 。 大 多 数 UNIX 系统 使 用 上 面 所 示 的 值 。 


^m SP 
10-2 给 出 了 一 个 简单 的 信号 处 理 程 序 , 它 捕 提 两 个 用 户 定 义 的 信号 并 打印 信和 号 编号 。10.10 
节 将 说 明 pause 函数， 它 使 调用 进程 在 接 到 一 信号 前 挂 起 。 
#include "apue.h" 
static void sig usr(int); /* one handler for both signals */ 
int 


main (void) 


{ 


if (signal(SIGUSR1, sig usr) == SIG ERR) 
err Sys("can't catch SIGUSR1"); 

if (signal(SIGUSR2, sig usr) -- SIG ERR) 
err sys("can't catch SIGUSR2"); 

for (7 7) 
pause (); 


} 


static void 
sig_usr(int signo) /* argument is signal number */ 


258 第 10 章 信号 


{ 
if (signo == SIGUSR1) 
printf ("received SIGUSRI\n"); 
else if (signo == SIGUSR2) 
printf ("received SIGUSR2\n"); 
else 
err_dump ("received signal %d\n", signo); 


图 10-2 ”捕捉 SIGUSR1 和 SIGUSR2 的 简单 程序 
我 们 使 该 程序 在 后 台 运 行 ， 并 且 用 ki11(1) 命 令 将 信号 发 送 给 它 。 注 意 ， 在 UNIX 系统 中 ， 
杀 死 (kl) 这 个 术语 是 不 恰当 的 。ki11(1) 命 令 和 kil11(2) 函 数 只 是 将 一 个 信号 发 送 给 一 个 进程 
或 进程 组 。 该 信号 是 否 终止 进程 则 取决 于 该 信号 的 类 型 ， 以 及 进程 是 否 安排 了 捕捉 该 信号 。 
$ ./a.out & 在 后 台 和 启动 进程 


(1) 7216 作业 控制 shell 打印 作业 编号 和 进程 中 

$ kill -USR1 7216 向 该 进程 发 送 SIGUSRI 

received SIGUSR1 

$ kill -USR2 7216 向 该 进程 发 送 STGUSR2 

received SIGUSR2 

$ kill 7216 向 该 进程 发 送 SIGTERM 

[1]* Terminated ./a.out 

因为 执行 图 10-2 程序 的 进程 不 捕捉 SIGTERM 信号 ， 而 对 该 信号 的 系统 默认 动作 是 终止 ， 所 
以 当 向 该 进程 发 送 SIGTERM 信和 号 后 ， 该 进程 就 终止 。 " 

1. 程序 启动 


当 执 行 -- 个 程序 时 ， 所 有 信号 的 状态 都 是 系统 默认 或 忽略 。 通 常 所 有 信号 都 被 设置 为 它们 的 默 
认 动 作 ， 除 非 调用 exec 的 进程 忽略 该 信号 。 确 切 地 讲 ，exec 函数 将 原先 设置 为 要 捕 提 的 信号 都 
更 改 为 默认 动作 ， 其 他 信和 号 的 状态 则 不 变 〈 一 个 进程 原先 要 捕捉 的 信号 ， 当 其 执行 一 个 新 程序 后 ， 
就 不 能 再 捕 担 了， 因为 信号 捕捉 函数 的 地 址 很 可 能 在 所 执行 的 新 程序 文件 中 已 无 意义 )。 

一 个 具体 例子 是 一 个 交互 shell 如 何 处 理 针对 后 台 进 程 的 中 断 和 退出 信号 。 对 于 一 个 非 作 业 控 
fil shell， 当 在 后 台 执 行 一 个 进程 时 ， 例 如 ; 

cc main.c & 
shell 自动 将 后 台 进 程 对 中 断 和 退出 信号 的 处 理 方 式 设置 为 忽略 。 于 是 ， 当 按 下 中 断 字符 时 就 不 会 
影响 到 后 台 进 程 。 如 果 没 有 做 这 样 的 处 理 ， 那 么 当 按 下 中 断 字符 时 ， 它 不 但 终止 前 台 进 程 ， 也 终 
止 所 有 后 台 进 程 。 

很 多 捕捉 这 两 个 信号 的 交互 程序 具有 下 列 形式 的 代码 : 


void sig int(int), sig_quit (int); 


if (signal(SIGINT, SIG IGN) !- SIG IGN) 
signal(SIGINT, sig int); 
if (signal(SIGQUIT, SIG IGN) !- SIG IGN) 


signal(SIGQUIT, sig quit); 


这 样 处 理 后 ， 仅 当 SIGINT 和 SIGQUIT 当前 未 被 忽略 时 ， 进 程 才 会 捕 提 人 它们。 


从 signal 的 这 两 个 调用 中 也 可 以 看 到 这 种 函数 的 限制 : 不 改变 信号 的 处 理 方式 就 不 能 确定 
信号 的 当前 处 理 方式 。 我 们 将 在 本 章 的 稍 后 部 分 说 明 使 用 sigaction 函数 可 以 确定 一 个 信号 的 
处 理 方 式 ， 而 无 需 改 变 它 。 
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2. 进程 创建 
当 一 个 进程 调用 fork 时 ， 其 子 进程 继承 父 进程 的 信号 处 理 方 式 。 因 为 子 进程 在 开始 时 复制 
了 父 进程 内 存 映像 ， 所 以 信号 捕捉 函数 的 地 址 在 子 进程 中 是 有 意义 的 。 


10.4 不 可 靠 的 信号 


在 早期 的 UNIX 版 本 中 (如 VD, 信号 是 不 可 靠 的 。 不 可 靠 在 这 里 指 的 是 , 信号 可 能 会 丢失 : 
一 个 信号 发 生 了 ， 但 进程 却 可 能 一 直 不 知道 这 一 点 。 同 时 ， 进 程 对 信号 的 控制 能 力也 很 差 ， 它 能 
捕捉 信号 或 忽略 它 。 有 时 用 户 希 望 通知 内 核 阻 塞 某 个 信号 : 不 要 忽略 该 信号 , 在 其 发 生 时 记 住 它 ， 
然后 在 进程 做 好 了 准备 时 再 通知 它 。 这 种 阻塞 信号 的 能 力 当 时 并 不 具备 。 


4.2BSD 对 信号 机 制 进行 了 更 改 ， 提 供 了 被 称 为 可 靠 信号 的 机 制 。 然 后 ，SVR3 也 修改 了 信号 
” 机制， 提供 了 System V 可 靠 信号 机 制 。POSIX.1 选择 了 BSD 模型 作为 其 标准 化 的 基础 。 


早期 版 本 中 的 一 个 问题 是 在 进程 每 次 接 到 信号 对 其 进行 处 理 时 ， 随 即将 该 信号 动作 重 置 为 默 
认 值 (在 前 面 运行 图 10-2 程序 时 ， 每 种 信号 只 捕 提 一 次 ， 从 而 回避 了 这 一 点 )。 在 描述 这 些 早期 
系统 的 编程 书籍 中 ， 有 一 个 经 典 实例 ， 它 与 如 何 处 理 中 断 信 号 相关 ， 其 代码 与 下 面 所 示 的 相似 ， 


int sig int(); /* my signal handling function */ 
signal (SIGINT, sig int); /* establish handler */ 


sig int() 

( 
Signal(SIGINT, sig int); /* reestablish handler for next time */ 
: /* process the signal ... */ 


} 


《由 于 早期 的 C 语言 版 本 不 支持 ISO C 的 void 数据 类 型 ， 所 以 将 信号 处 理 程序 声明 为 int 类 型 。) 

这 段 代码 的 一 个 问题 是 : 在 信号 发 生 之 后 到 信和 号 处 理 程序 调用 signal ARCHANA 
窗口 。 在 此 段 时 间 中 ， 可 能 发 生 另 一 次 中 断 信号 。 第 二 个 信和 号 会 造成 执行 默认 动作 ， 而 对 中 断 信 
号 的 默认 动作 是 终止 该 进程 。 这 种 类 型 的 程序 段 在 大 多 数 情 况 下 会 正常 工作 ， 使 得 我 们 认为 它们 
是 正确 无 误 的 ， 而 实际 上 却 并 非 如 此 。 

这 些 早期 版 本 的 另 一 个 问题 是 ， 在 进程 不 希望 某 种 信号 发 生 时 ， 它 不 能 关闭 该 信号 。 进 程 能 
做 的 一 切 就 是 忽略 该 信号 。 有 时 希望 通知 系统 “阻止 下 列 信号 发 生 ， 如 果 它 们 确实 产生 了 ， 请 记 
住 它们 。” 能 够 显现 这 种 缺陷 的 的 一 个 经 典 实例 是 下 列 程序 段 ， 它 捕捉 一 个 信号 ， 然 后 设置 一 个 
表示 该 信号 已 发 生 的 标志 : 


int sig int(); /* my signal handling function */ 
int sig int flag; /* set nonzero when signal occurs */ 
main () 

{ 


signal (SIGINT, sig int); /* establish handler */ 


while (sig_int_flag == 0) 
pause ()}; /* go to sleep, waiting for signal */ 


} 
sig_int() 
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{ 
signal (SIGINT, sig int); /* reestablish handler for next time */ 
sig int flag = 1; /* set flag for main loop to examine */ 
} 


其 中 ， 进 程 调用 pause 函数 使 自己 休眠 ， 直 到 捕捉 到 一 个 信号 。 当 捕捉 到 信号 时 ， 信 号 处 理 程 
序 将 标志 sig int flag 设置 为 非 0 值 。 从 信号 处 理 程序 返回 后 ， 内 核 自 动 将 该 进程 唤醒 ， 它 
检测 到 该 标志 为 非 0， 然 后 执行 它 所 需 做 的 。 但 是 这 里 有 一 个 时 间 窗 口 ， 在 此 窗口 中 操作 可 能 失误 。 
如 果 在 测试 sig_int_flag 之 后 、 调 用 pause 之 前 发 生 信号 ， 则 此 进程 在 调用 pause 时 可 能 
将 永久 休眠 〈 假 定 此 信和 号 不 会 再 次 产生 )。 于 是 ， 这 次 发 生 的 信号 也 就 丢失 了 。 这 是 另 一 个 例子 ， 
某 段 代码 并 不 正确 ， 但 是 大 多 数 时 间 却 能 正常 工作 。 要 查找 并 排除 这 种 类 型 的 问题 很 困难 。 


10.5 中断 的 系统 调用 


早期 UNIX 系统 的 一 个 特性 是 : 如果 进 程 在 执行 一 个 低速 系统 调用 而 阻塞 期 间 捕 提 到 一 个 信 
号 ， 则 该 系统 调用 就 被 中 断 不 再 继续 执行 。 该 系统 调用 返回 出 错 ， 其 errno 设置 为 EINTR。 这 
样 处 理 是 因为 一 个 信号 发 生 了 ， 进 程 捕捉 到 它 ， 这 意味 着 已 经 发 生 了 某 种 事情 ， 所 以 是 个 好 机 会 
应 当 唤 醒 阻 塞 的 系统 调用 。 


在 这 里 ,我 们 必须 区 分 系统 调用 和 函数 。 当 捕捉 到 某 个 信号 时 , 被 中 断 的 是 内 核 中 执行 的 系统 调用 。 


为 了 支持 这 种 特性 ， 将 系统 调用 分 成 两 类 : 低速 系统 调用 和 其 他 系统 调用 。 低 速 系统 调用 是 
可 能 会 使 进程 永远 阻塞 的 - -类 系统 调用 ， 包 括 : 
e 如 果 某 些 类 型 文件 〈 如 读 管道 、 终 端 设备 和 网 络 设备 ) 的 数据 不 存在 ， 则 读 操 作 可 能 会 
使 调用 者 永远 阻塞 ， 
e 如 果 这 些 数据 不 能 被 相同 的 类 型 文件 立即 接受 ， 则 写 操 作 可 能 会 使 调用 者 永远 阻塞 ， 
e 在 某 种 条 件 发 生 之 前 打开 某 些 类 型 文件 ， 可 能 会 发 生 阻 塞 〈 例 如 要 打开 一 个 终端 设备 ， 
需要 先 等 待 与 之 连接 的 调制 解 调 器 应 答 ); 
« pause 函数 (按照 定 义 ， 它 使 调用 进程 休眠 直至 捕捉 到 一 个 信号 ) 和 wait 函数; 
e. $H ioctl 操作 ; 
某 些 进程 间 通 信函 数 〈 见 第 15 章 )。 
ARAMA 一 个 值得 注意 的 例外 是 与 磁盘 VO 有 关 的 系统 调用 。 虽 然 读 、 写 一 
个 磁盘 文件 可 能 暂时 阻塞 调用 者 (在 磁盘 驱动 程序 将 请 求 排 入 队列 ， 然 后 在 适当 时 间 执 行 请 求 期 
间 )， 但 是 除非 发 生硬 件 错误 ，1/O 操作 总 会 很 快 返回 ， 并 使 调用 者 不 再 处 于 阻塞 状态 。 
可 以 用 中 断 系 统 调用 这 种 方法 来 处 理 的 一 个 例子 是 ， 一 个 进程 启动 了 读 终 端 操作 ， 而 使 用 该 
终端 设备 的 用 户 却 离开 该 终端 很 长 时 间 。 在 这 种 情况 下 ， 进 程 可 能 处 于 阻塞 状态 几 个 小 时 甚至 数 
天 ， 除 非 系统 停机 ， 否 则 一 直 如 此 。 


对 于 中 断 的 read. write 系统 调用 ，POSIX.1 的 语义 在 该 标准 的 2001 版 有 所 改变 。 对 于 如 
何 处 理 已 read, write 部 分 数据 量 的 相应 系统 调用 ， 早 期 版 本 允许 实现 自行 选择 。 如 若 read 

， 系统 调用 已 接收 并 传送 数据 至 应 用 程序 缓冲 区 ， 但 尚未 接收 到 应 用 程序 请 求 的 全 部 数据 ， 此 时 被 
”中 断 ， 操 作 系统 可 以 认为 该 系统 调用 失败 ， 并 将 errno 设置 为 EINTR; 另 一 种 处 理 方式 是 允许 
， 该 系统 调用 成 功 返 回 ， 返回 值 是 已 接收 到 的 数据 量 。 与 此 类 似 ， 如 车 write 已 传输 了 应 用 程序 组 
， 冲 区 中 的 部 分 数据 ,然后 被 中 断 , 操作 系统 可 以 认为 该 系统 调用 失败 ， 并 将 errno 设置 为 EINTR; 
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另 一 种 处 理 方式 是 允许 该 系统 调用 成 功 返 回 ， 返 回 值 是 已 写 部 分 的 数据 量 。 历 史上 ， 从 System V 
派生 的 实现 将 这 种 系统 调用 视 为 失败 ， 而 BSD 派生 的 实现 则 处 理 为 部 分 成 功 返回 。2001 版 POSIX! 
标准 采用 BSD 风格 的 语义 。 


与 被 中 断 的 系统 调用 相关 的 问题 是 必须 显 式 地 处 理 出 错 返回 。 典 型 的 代码 序列 假定 进行 一 
个 读 操 作 ， 它 被 中 断 ， 我 们 希望 重新 启动 它 》 如 下 : 
SM (tn = read(fd, buf, BUFFSIZE)) < O) { 
if (errno == EINTR) 
goto again; /* just an interrupted system call */ 


/* handle other errors */ 
) 


为 了 帮助 应 用 程序 使 其 不 必 处 理 被 中 断 的 系统 调用 , 4.2BSD 引进 了 某 些 被 中 断 系统 调用 的 自 
动 重启 动 。 自 动 重 启动 的 系统 调用 包括 : ioctl, read. readv. write. writev. wait 和 
waitpid。 如 前 所 述 ， 其 中 前 5 个 函数 只 有 对 低速 设备 进行 操作 时 才 会 被 信号 中 断 。 而 wait 和 
waitpid 在 捕捉 到 信和 号 时 总 是 被 中 断 。 因 为 这 种 自动 重启 动 的 处 理 方式 也 会 带 来 问题 ， 某 些 应 用 
程序 并 不 希望 这 些 函 数 被 中 断后 重启 动 。 为 此 4.3BSD 允许 进程 基于 每 个 信号 禁用 此 功能 。 
， POSIX.1 要 求 只 有 中 断 信号 的 SA_RESTART 标志 有 效 时 ， 实 现 才 重启 动 系 统 调用 。 在 10.14 
| 节 将 看 到 ，sigaction 函数 使 用 这 个 标志 允许 应 用 程序 请 求 重启 动 被 中 断 的 系统 调用 。 
| BEL, 使 用 signal 函数 建立 信号 处 理 程序 时 ， 对 于 如 何 处 理 被 中 断 的 系统 调用 ， 各 种 实 
| 现 的 做 法 各 不 相同 。System V 的 默认 工作 方式 是 从 不 重启 动 系统 调用 。 而 BSD 则 重启 动 被 信号 中 
| WG RAIA, FreeBSD 8.0, Linux 3.2.0 和 Mac OS X 10.6.8 中 ， 当 信号 处 理 程序 是 用 signal 
函数 时 ， 被 中 断 的 系统 调用 会 重启 动 。 但 Solaris 10 的 默认 方式 是 出 错 返 回 ,将 errno 设置 为 
EINTR。 使 用 用 户 自己 实现 的 signal BH (VA 10-18 ) 可 以 避免 必须 处 理 这 些 差 异 的 麻烦 。 


4.2BSD 引入 自动 重启 动 功能 的 一 个 理由 是 : 有 时 用 户 并 不 知道 所 使 用 的 输入 、 输出 设备 是 否 
是 低速 设备 。 如 果 我 们 编写 的 程序 可 以 用 交互 方式 运行 ， 则 它 可 能 读 、 写 终端 低速 设备 。 如 果 在 
程序 中 捕 提 信和 号， 而且 系 统 并 不 提供 重启 动 功能 ， 则 对 每 次 读 、 写 系统 调用 就 要 进行 是 否 出 错 返 
回 的 测试 ， 如 果 是 被 中 断 的 ， 则 再 调用 读 、 写 系统 调用 。 

] 10-3 列 出 了 几 种 实现 所 提供 的 与 信号 有 关 的 函数 及 它们 的 语义 。 


信号 处 理 程 | 阻塞 信号 | 被 中 断 系统 调用 
序 仍 被 安装 | HEN cel 自动 重启 动 ? 






V7. SVR2. SVR Ere ES 
signal | SVRA. Solaris a eee EY ee 







4.2BSD [oo [| * j| k | 
43BSD. 44BSD. FreeBSD. Linux. MacOSX | 。 | 。 | a | 


siudctioh POSIX.1. 4.4BSD. SVR4. FreeBSD, Linux. ES 
id Mac OS X. Solaris 
10-3 ” 几 种 信号 实现 所 提供 的 功能 


应 当 了 解 ， 其 他 厂商 提供 的 UNIX 系统 可 能 不 同 于 图 10-3 中 所 示 的 情况 。 例如，SunOS 4.1.2 
中 的 sigaction 默认 方式 是 重启 动 被 中 断 的 系统 调用 ， 这 与 列 在 图 10-3 中 的 各 平台 不 同 。 
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在 图 10-18 中 ， 提 供 了 我 们 自己 的 signal 函数 版 本 ， 它 自动 地 尝试 重启 动 被 中 断 的 系统 调 
H (BR SIGALRM 信号 外 )。 在 图 10-19 中 则 提供 了 另 一 个 函数 signal_intr， 它 不 进行 重启 动 。 
在 14.4 节 说 明 select 和 poll 请 数 时 ， 还 将 更 多 涉及 被 中 断 的 系统 调用 。 


10.6 ”可 重 入 函数 


进程 捕捉 到 信和 号 并 对 其 进行 处 理 时 ， 进 程 正在 执行 的 正常 指令 序列 就 被 信号 处 理 程序 临时 中 
断 ， 它 首先 执行 该 信号 处 理 程序 中 的 指令 。 如 果 从 信号 处 理 程 序 返 回 〔〈 例 如 没有 调用 exit 或 
longjmp)， 则 继续 执行 在 捕捉 到 信号 时 进程 正在 执行 的 正常 指令 序列 (这 类 似 于 发 生硬 件 中 断 
时 所 做 的 )。 但 在 信号 处 理 程序 中 ， 不 能 判断 捕捉 到 信号 时 进程 执行 到 何 处 。 如 果 进 程 正在 执行 
malloc， 在 其 堆 中 分 配 另 外 的 存储 空间 ， 而 此 时 由 于 捕 提 到 信号 而 插入 执行 该 信号 处 理 程序 ， 
其 中 又 调用 malloc， 这 时 会 发 生 什 么 ”又 例如 ， 关 进程 正在 执行 getpwnam (A 6.2 节 ) 这 种 
将 其 结果 存放 在 静态 存储 单元 中 的 函数 ， 其 间 播 入 执行 信号 处 理 程序 ， 它 又 调用 这 样 的 函数 ， 这 
时 又 会 发 生 什 么 呢 ? fEmalloc 例子 中 ， 可 能 会 对 进程 造成 破坏 ， 因 为 malloc 通常 为 它 所 分 配 
的 存储 区 维护 一 个 链表 ， 而 插入 执行 信号 处 理 程 序 时 ， 进 程 可 能 正在 更 改 此 链表 。 在 getpwnam 
的 例子 中 ， 返 回 给 正常 调用 者 的 信息 可 能 会 被 返回 给 信和 号 处 理 程序 的 信息 覆盖 。 

Single UNIX Specification 说 明了 在 信号 处 理 程序 中 保证 调用 安全 的 函数 。 这 些 函 数 是 可 重 入 
的 并 被 称 为 是 异步 信号 安全 的 Casync-signal safe)。 除 了 可 重 入 以 外 ， 在 信号 处 理 操作 期 间 ， 它 会 
阻塞 任何 会 引起 不 一 致 的 信号 发 送 。 图 10-4 列 出 了 这 些 异 步 信 号 安全 的 函数 。 没 有 列 入 图 10-4 中 


abort 
accept 
access 

aio error 
aio return 
aio suspend 
alarm 

bind 
cfgetispeed 
cfgetospeed 
cfsetispeed 
cfsetospeed 
chdir 

chmod 

chown 


clock gettime 


faccessat 
fchmod 
fchmodat 
fchown 
fchownat 
fcntl 
fdatasync 


ftruncate 
futimens 


getegid 


geteuid 
getgid 
getgroups 
getpeername 


getsockname 
getsockopt 
getuid 
kill 

link 


linkat 
listen 
lseek 
lstat 
mkdir 
mkdirat 
mkfifo 
mkfifoat 
mknod 
mknodat 
open 
openat 
pause 
pipe 
poll 
posix trace event 
pselect 
raise 
read 
readlink 
readlinkat 
recv 
recvfrom 
recvmsg 
rename 
renameat 
rmdir 


select 

sem post 
send 
sendmsg 
sendto 
setgid 
setpgid 
setsid 
setsockopt 
setuid 
shutdown 
sigaction 
Sigaddset 
sigdelset 
sigemptyset 
sigfillset 
sigismember 
signal 
sigpause 
sigpending 
sigprocmask 
sigqueue 
sigset 
sigsuspend 
sleep 
socketmark 
socket 


10-4 ”信和 号 处 理 程序 可 以 调用 的 可 重 入 函数 


socketpair 
stat 

symlink 
symlinkat 
tcdrain 
tcflow 
tcflush 
tcgetattr 
tcgetpgrp 
tcsendbreak 
tcsetattr 
tcsetpgrp 
time 

timer getoverrun 
timer gettime 
timer settime 
times 

umask 

uname 

unlink 
ulinkat 
utime 
utimensat 
utimes 

wait 

waitpid 
write 
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的 大 多 数 函 数 是 不 可 重 入 的 ， 因 为 (a) 已 知 它们 使 用 静态 数据 结构 ; (bo) 它们 调用 malloc 或 
free; (c) 它们 是 标准 VO 函数 。 标 准 VO 库 的 很 多 实现 都 以 不 可 重 入 方式 使 用 全 局 数据 结构 。 
注意 ， 虽 然 在 本 书 的 某 些 实例 中 ， 信 和 号 处 理 程 序 也 调用 了 printf 溺 数 ， 但 这 并 不 保证 产生 所 期 
望 的 结果 ， 信 和 号 处 理 程序 可 能 中 断 主 程序 中 的 printf 函数 调用 。 

应 当 了 解 , 即使 信号 处 理 程 序 调 用 的 是 图 10-4 中 的 函数 , 但 是 由 于 每 个 线程 只 有 一 个 errno 
变量 (回忆 1.7 节 对 errno 和 线程 的 讨论 )， 所 以 信和 号 处 理 程序 可 能 会 修改 其 原先 值 。 考 虑 一 个 
信和 号 处 理 程序 , 它 恰好 在 main 刚 设 置 errno 之 后 被 调用 。 如 果 该 信号 处 理 程 序 调用 read 这 类 [329 
函数 ,， 则 它 可 能 更 改 errno 的 值 ， 从 而 取代 了 刚 由 main 设置 的 值 。 因此 , 作为 一 个 通用 的 规则 ， 
当 在 信号 处 理 程序 中 调用 图 10-4 中 的 函数 时 ,应当 在 调用 前 保存 errno, 在 调用 后 恢复 errno. 
(应 当 了 解 ， 经 常 被 捕捉 到 的 信号 是 SIGCHLD， 其 信号 处 理 程序 通常 要 调用 一 种 wait BR, i 
各 种 wait 函数 都 能 改变 errno.) 

注意 ， 图 10-4 没有 包括 longjmp (7.10 节 ) 和 siglongjmp (10.15 节 )。 这 是 因为 主 例 程 
以 非 可 重 入 方式 正在 更 新 一 个 数据 结构 时 可 能 产生 信号 。 如 果 不 是 从 信和 号 处 理 程序 返回 而 是 调用 
siglongjmp， 那 么 该 数据 结构 可 能 是 部 分 更 新 的 。 如 果 应 用 程序 将 要 做 更 新 全 局 数据 结构 这 样 
的 事情 ， 而 同时 要 捕捉 某 些 信号 ， 而 这 些 信 和 号 的 处 理 程序 又 会 引起 执行 siglongjmp， 则 在 更 新 
这 种 数据 结构 时 要 阻塞 此 类 信和 号。 


让 实例 
10-5 给 出 了 一 段 程序 ， 这 段 程序 从 信号 处 理 程序 my_alarm 亩 用 非 可 重 入 函数 getpwnam, 
而 my alarm 每 秒 钟 被 调用 一 次 。10.10 节 中 将 说 明 alarm 函数 。 在 该 程序 中 调用 alarm 函数 
使 得 每 秒 产生 一 次 SIGALRM 信号 。 [331] 


#include "apue.h" 
#include <pwd.h> 


static void 
my_alarm(int signo) 
{ 


struct passwd *rootptr; 


printf("in signal handler\n"); 


if ((rootptr = getpwnam("root")) == NULL) 
err sys("getpwnam(root) error"); 
alarm(1); 


! 


int 
main (void) 
f 
struct passwd *ptr; 


signal(SIGALRM, my alarm); 
alarm(1); 
for (7; : ) t 
if ((ptr = getpwnam("sar")) == NULL) 
err sysS("getpwnam error"); 
if (strcmp(ptr-»pw name, "sar") != 0) 
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printf("return value corrupted!, pw name = %s\n", 
ptr-»pw name); 


图 10-5 在 信号 处 理 程序 中 调用 不 可 再 入 函数 


运行 该 程序 时 ， 其 结果 具有 随机 性 。 通 常 ， 在 信号 处 理 程序 经 多 次 迭代 返回 时 ， 该 程序 
将 由 SIGSEGV 信号 终止 。 检查 core 文件 ， 从 中 可 以 看 到 main 函数 已 调用 getpwnam， 但 
当 getpwnam 调用 free 时 ,信号 处 理 程序 中 断 了 它 的 运行 ， 并 调用 getpwnam， 进 而 再 次 调 
用 free。 在 信号 处 理 程 序 调用 free 而 主 程序 也 在 调用 free 时 ，malloc 和 free 维护 的 数 
据 结 构 就 出 现 了 损坏 ， 侦 然 ， 此 程序 会 运行 若干 秒 ， 然 后 因 产 生 SIGSEGV 信号 而 终止 。 在 捕捉 
到 信号 后 ， 若 main 函数 仍 正确 运行 ， 其 返回 值 却 有 时 错误 ， 有 时 正确 。 

从 此 实例 中 可 以 看 出 ， 如 果 在 信号 处 理 程 序 中 调用 一 个 非 可 重 入 函数 ， 则 其 结果 是 不 可 预 


zI 


知 的 。 a 
10.7 SIGCLD 语义 


SIGCLD 和 SIGCHLD 这 两 个 信号 很 容易 被 混淆 。SIGCLD (HE H) 是 System V 的 一 个 信号 
名 ， 其 语义 与 名 为 SIGCHLD 的 BSD 信号 不 同 。POSIX.1 采用 BSD 的 SIGCHLD 信号。 

332 BSD 的 SIGCHLD 信和 号 语义 与 其 他 信号 的 语义 相 类 似 。 子 进程 状态 改变 后 产生 此 信号 ， 父 进 
程 需要 调用 一 个 wait 函数 以 检测 发 生 了 什么 。 

System V 处 理 SIGCLD 信和 的 方式 不 同 于 其 他 信和 号。 如 果 用 signal 或 sigset (早期 设置 
信和 号 配置 的 ， 与 SRV3 兼容 的 函数 ) 设置 信号 配置 ， 则 基于 SVR4 的 系统 继承 了 这 一 具有 问题 色 
彩 的 传统 〈 即 兼容 性 限制 )。 对 于 SIGCLD 的 星期 处 理 方式 是 ， 

C1) 如 果 进 程 明确 地 将 该 信号 的 配置 设置 为 SIG_IGN， 则 调用 进程 的 子 进程 将 不 产生 僵 死 进 
程 。 注 意 ， 这 与 其 默认 动作 (SIG_DFL)“ 和 忽略 ”( 见 图 10-1) 不 同 。 子 进程 在 终止 时 ， 将 其 状态 
丢弃 。 如 果 调 用 进程 随后 调用 一 个 wait 函数 ， 那 么 它 将 阻塞 直到 所 有 子 进程 都 终止 ， 然 后 该 wait 
会 返回 -1， 并 将 其 errno 设置 为 ECHILD。( 此 信号 的 默认 配置 是 忽略 ， 但 这 不 会 使 上 述 语 义 起 
作用 。 必 须 将 其 配置 明确 指定 为 SIG_IGN 才 可 以 。) 


| POSIX.l 并 未 说 明 在 SIGCHLD 被 忽略 时 应 产生 的 后 果 ， 所 以 这 种 行为 是 允许 的 。Single UNIX 
| Specification 的 XSI 扩展 选项 要 求 对 于 SIGCHLD 支持 这 种 行为 。 
O W SIGCHLD 被 忽略 ，4.4BSD 总 是 产生 僵 死 进程 。 如 果 要 避免 僵 死 进程 ， 则 必须 等 待 子 进 
. 程 。 在 SVR4 中 ， 如 果 调 用 signal 或 sigset 将 SIGCHLD 的 配置 设置 为 忽略 ， 则 决 不 会 产生 
， 僵 死 进程 。 本 书 讨论 的 4 种 平台 在 此 方面 都 追随 SVR4 的 行为 。 
使 用 sigaction 可 设置 SA_NOCLDWAIT 42% ( UB 10-6) 以 避免 进程 伪 死 。 本 书 讨 论 的 4 
种 平台 都 支持 这 一 点 。 
(2) 如 果 将 SIGCLD 的 配置 设置 为 捕捉 ， 则 内 核 立 即 检查 是 否 有 子 进 程 准 备 好 被 等 待 ， 如 果 


是 这 样 ， 则 调用 SIGCLD 处 理 程序 。 
第 2 种 方式 改变 了 为 此 信号 编写 处 理 程 序 的 方法 ， 这 一 点 可 在 下 面 的 实例 中 看 到 。 
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10.4 节 曾 提 到 ， 进 入 信号 处 理 程序 后 ， 首 先 要 调用 signal 函数 以 重新 设置 此 信号 处 理 程序 
(在 信号 被 重 置 为 其 默认 值 时 ， 它 可 能 会 丢失 ,立即 重新 设置 可 以 减少 此 窗口 时 间 )。 图 10-6 展示 
了 这 一 点 。 但 此 程序 不 能 在 某 些 传统 的 System V 平台 上 正常 工作 。 程 序 一 行 行 地 不 断 重复 输出 
“SIGCLD received”， 最 后 进程 用 完 其 栈 空间 并 异常 终止 。 


#include "apue.h" 
#include <sys/wait.h> 





static void sig cld(int); 


int 
main () 
{ 
pid_t pid; 


if (signal (SIGCLD, sig cld) == SIG ERR) 
perror("signal error"); 

if ((pid = fork()) < 0) { 
perror("fork error"); 

) else if (pid == 0) { /* child */ 
sleep (2): 
_exit (0); 

} 


pause(); /* parent */ 
exit (0); 
} 


static void 
sig cld(int signo) /* interrupts pause() */ 
{ 

pid_t pid; 

int status; 


printf("SIGCLD received\n"); 


if (signal(SIGCLD, sig_cld) == SIG_ERR) /* reestablish handler */ 
perror("signal error"); 


if ((pid = wait(&status)) < 0) /* fetch child status */ 
perror("wait error"); 


printf("pid = d\n", pid); 


10-6 不 能 正常 工作 的 System V SIGCLD 处 理 程序 


因为 基于 BSD 的 系统 通常 并 不 支持 早期 System V 的 SIGCLD 语义 ， 所 以 FreeBSD 8.0 和 Mac 
“OS X 10.6.8 并 没有 出 现 此 问题 。Linux 3.2.0 也 没有 出 现 此 问题 ， 其 原因 是 ， 有 虽然 SIGCLD 和 
SIGCHLD 定义 为 相同 的 值 ， 但 当 一 个 进程 安排 捕捉 STGCHLD， 并 且 已 经 有 进程 准备 好 由 其 父 进 
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， 程 等 待 时 ， 该 系统 并 不 调用 SIGCHLD 信号 的 处 理 程序 。Solaris 10 在 此 种 情况 时 确实 调用 该 信号 

| 处 理 程序 ， 但 在 内 核 中 增加 了 避免 此 问题 的 代码 。 

| 虽然 本 书 说 明 的 所 有 4 种 平台 都 解决 了 这 一 问题 ， 但 是 应 当 意 识 到 没有 解决 这 一 问题 的 平台 
| (如 AIX ) 依然 存在 。 


此 程序 的 问题 是 : 在 信号 处 理 程序 的 开始 处 调用 signal， 按照 上 述 第 2 种 方式 ， 内 核 
检查 是 否 有 需要 等 待 的 子 进程 (因为 我 们 正在 处 理 一 个 SIGCLD 信和 号, 所 以 确实 有 这 种 子 进 
程 )， 所 以 它 产生 另 一 个 对 信号 处 理 程 序 的 调用 。 信 号 处 理 程 序 调用 signal. Xe xLPRBI 
次 重复 。 

为 了 解决 这 一 问题 ， 应 当 在 调用 wait 取 到 子 进程 的 终止 状态 后 再 调用 signal, WARA 
其 他 子 进 程 终止 ， 内 核 才 会 再 次 产生 此 种 信号 。 


如 果 为 SIGCHLD 建立 了 一 个 信号 处 理 程序 ， 又 存在 一 个 已 终止 但 父 进 程 尚 未 等 待 它 的 进程 ， 
| 则 是 否 会 产生 信号 ? POSIX.1 对 此 没有 做 说 明 。 这 就 允许 前 面 所 述 的 工作 方式 。 但 是 ，POSIX.1 
| 在 信号 发 生 时 并 没有 将 信号 处 理 重 置 为 其 默认 值 (假定 正 调用 POSIX.] 的 sigaction 函数 设置 
”其 配置 )， 于 是 在 SIGCHLD 处 理 程序 中 也 就 不 必 再 为 该 信号 指定 一 个 信号 处 理 程序 。 - 


务必 了 解 你 所 用 的 系统 实现 中 SIGCHLD 信号 的 语义 。 也 应 了 解 在 某 些 系统 中 #define 
SIGCHLD 为 SIGCLD 或 反之 。 更 改 这 种 信号 的 名 字 使 你 可 以 编译 为 男 一 个 系统 编写 的 程序 ， 但 是 
如 果 这 一 程序 使 用 该 信号 的 另 一 种 语义 ， 程 序 有 可 能 不 会 正常 工作 。 


在 本 书 说 明 的 4 种 平台 上 ， 只 有 Linux 3.2.0 和 Solaris 10 定义 了 SIGCLD, SIGCLD 等 同 于 
: SIGCHLD» 


10.8 可靠 信 号 术语 和 语义 


我 们 需要 先 定义 一 些 在 讨论 信号 时 会 用 到 的 术语 。 首 先 ， 当 造成 信号 的 事件 发 生 时 ， 为 进程 
产生 一 个 信号 (或 向 一 个 进程 发 送 一 个 信号 )。 事 件 可 以 是 硬件 异常 (如 除 以 0)、 软 件 条 件 〈 如 
alarm 定时 器 超时 )、 终 端 产生 的 信号 或 调用 kill 函数 。 当 - -个 信号 产生 时 ， 内 核 通 常 在 进程 
表 中 以 某 种 形式 设置 一 个 标志 。 

当 对 信号 采取 了 这 种 动作 时 ， 我 们 说 向 进程 递送 了 一 个 信号 。 在 信号 产生 (generation〉 和 递 
送 〈delivery) 之 闻 的 时 间 间 隔 内 ， 称 信号 是 未 决 的 《pending)。 

进程 可 以 选用 “阻塞 信号 递送 ”。 如 果 为 进程 产生 了 一 个 阻塞 的 信号 ， 而 且 对 该 信号 的 动作 
是 系统 默认 动作 或 捕捉 该 信号 ， 则 为 该 进程 将 此 信和 号 保持 为 未 决 状态 ， 直 到 该 进程 对 此 信和 号 解除 
了 阻塞 ， 或 者 将 对 此 信和 号 的 动作 更 改 为 忽略 。 内 核 在 递送 一 个 原来 被 阻塞 的 信号 给 进程 时 【〈 而 不 
是 在 产生 该 信号 时 )， 才 决定 对 它 的 处 理 方式 。 于 是 进程 在 信号 递送 给 它 之 前 仍 可 改变 对 该 信和 号 

的 动作 。 进 程 调用 sigpending 函数 CH 10.13 节 ) 来 判定 哪些 信号 是 设置 为 阻塞 并 处 于 未 决 状 

如 果 在 进程 解除 对 某 个 信号 的 阻塞 之 前 ， 这 种 信号 发 生 了 多 次 ， 那 么 将 如 何 昵 ? POSIX.1 ft 
许 系 统 递送 该 信号 一 次 或 多 次 。 如 果 递 送 该 信号 多 次 ， 则 称 这 些 信 号 进行 了 排队 。 但 是 除非 支持 
POSIX.1 实时 扩展 ， 和 否则 大 多 数 UNIX 并 不 对 信号 排队 ， 而 是 只 递送 这 种 信号 一 次 。 
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| SUSv4 中 ， 实 时 信和 号 功能 已 经 移 至 基础 规范 的 实时 扩展 部 分 。 随 着 时 间 的 推移 ， 更 多 的 系统 
即使 不 支持 实时 扩展 ， 也 会 支持 信号 排队 。 我 们 将 在 1020 节 中 进一步 讨论 排队 信号 。 

| SVR2 的 手册 页 称 ， 在 进程 执行 SIGCLD 信号 处 理 程序 期 间 ， 该 信号 是 用 排队 方式 处 理 的 ， 
虽然 在 概念 层次 这 可 能 是 真 的 ， 但 实际 并 非 如 此 。 内 核 是 按照 10.7 节 中 所 述 方式 产 生 此 信号 。SVR3 

， 的 手册 页 对 此 做 了 修改 , 它 指 明 在 进程 执行 SIGCLD 信号 处 理 程序 期 间 , 忽略 SIGCLD 信号 。SVR4 

| 手册 页 删除 了 有 关 部 分 。 

”AT&T[1990e] 中 的 SVR4 sigaction(2) 手 册页 称 SA_SIGINFO 标志 (VA 10-16) 使 信号 可 

， 靠 地 排队 ， 这 是 不 正确 的 。 表 面 上 内 核 部 分 地 实现 了 此 功能 ， 但 在 SVR4 中 并 不 起 作用 。 令 人 不 
可 思议 的 是 ，SVID (System V 接口 定义 ) 对 这 种 可 靠 队 列 并 未 做 同样 的 声明 。 


如 果 有 多 个 信号 要 递送 给 一 个 进程 ， 那 将 如 何 呢 ?POSIX.1 并 没有 规定 这 些 信 和 号 的 递送 顺序 。 但 
是 POSIX.1 基础 部 分 建议 ， 在 其 他 信号 之 前 递送 与 进程 当前 状态 有 关 的 信和 号， 如 SIGSEGV. 

每 个 进程 都 有 一 个 信号 屏蔽 字 (signal mask)， 它 规定 了 当前 要 阻塞 递送 到 该 进程 的 信号 集 。 对 
于 每 种 可 能 的 信号 ， 该 屏蔽 字 中 都 有 一 位 与 之 对 应 。 对 于 某 种 信号 ， 若 其 对 应 位 已 设置 ， 则 它 当 前 是 
被 阻塞 的 。 进 程 可 以 调用 sigprocmask (E 10.12 节 中 说 明 ) 来 检测 和 更 改 其 当前 信号 屏蔽 字 。 

信号 编号 可 能 会 超过 一 个 整 型 所 包含 的 二 进 制 位 数 ， 因 此 POSIX.1 定义 了 一 个 新 数据 类 型 
sigset tt， 它 可 以 容纳 一 个 信号 集 。 例 如 ， 信 和 号 屏蔽 字 就 存放 在 其 中 一 个 信号 集中 。10.11 节 将 
说 明 对 信号 集 进行 操作 的 5 个 函数 。 


10.9 PRR kill Ff raise 


kill 函数 将 信号 发 送 给 进程 或 进程 组 。raise 函数 则 允许 进程 向 自身 发 送信 号 。 
raise 最 初 是 由 1SOC 定义 的 。 后来， 为 了 与 ISOC 标准 保持 一 致 ，POSIX.1 也 包括 了 该 函 
数 。 但 是 POSIX.1 扩展 了 raise 的 规范 ， 使 其 可 处 理 线程 ( 12.8 中 讨论 线程 如 何 与 信号 交互 )。 
”因为 ISO C 并 不 涉及 多 进程 ， 所 以 它 不 能 定义 以 进程 ID 作为 其 参数 (如 kill BH) 的 函数 。 


#include <signal.h> 


int kill(pid_t pid, int signo); 


int raise(int signo); 





调用 
raise(signo); 
等 价 于 调用 
kill(getpid(), signo); 
kill 的 pid 参数 有 以 下 4 种 不 同 的 情况 。 
pid>0 将 该 信号 发 送 给 进程 ID 为 pid 的 进程 。 
pid — 0 将 该 信号 发 送 给 与 发 送 进程 属于 同一 进程 组 的 所 有 进程 〈 这 些 进程 的 进程 组 ID 
等 于 发 送 进程 的 进程 组 ID， 而 且 发 送 进程 具有 权限 向 这 些 进程 发 送信 号 。 这 
里 用 的 术语 “所 有 进程 ”不 包括 实现 定义 的 系统 进程 集 。 对 于 大 多 数 UNIX R 
统 ， 系 统 进 程 集 包 括 内 核 进程 和 init (pid JJ 1). 
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pid<0 将 该 信号 发 送 给 其 进程 组 ID 等 于 pid 绝对 值 , 而 且 发 送 进程 具有 权限 向 其 发 送 

信号 的 所 有 进程 。 如 前 所 述 ， 所 有 进程 并 不 包括 系统 进程 集中 的 进程 。 

pid---1 ”将 该 信号 发 送 给 发 送 进程 有 权限 向 它们 发 送信 号 的 所 有 进程 。 如 前 所 述 ， 所 有 

进程 不 包括 系统 进程 集中 的 进程 。 

如 前 所 述 ， 进 程 将 信号 发 送 给 其 他 进程 需要 权限 。 超 级 用 户 可 将 信号 发 送 给 任 一 进程 。 对 于 
非 超 级 用 户 ， 其 基本 规则 是 发 送 者 的 实际 用 户 ID 或 有 效用 户 ID 必须 等 于 接收 者 的 实际 用 户 ID 
或 有 效用 户 ID。 如 果实 现 支持 POSIX SAVED IDS (如 POSIX.1 现在 要 求 的 那样 )， 则 检查 接收 
者 的 保存 设置 用 户 ID《〈 而 不 是 有 效用 户 ID)。 在 对 权限 进行 测试 时 也 有 一 个 特例 ， 如 果 被 发 送 的 
信和 号 是 SIGCONT， 则 进程 可 将 它 发 送 给 属于 同一 会 话 的 任 一 其 他 进程 。 

POSIX. 将 信号 编号 0 EXA ZES. WME signo 参数 是 0, 则 kill 仍 执行 正常 的 错误 检查 ， 
但 不 发 送信 号 。 这 常 被 用 来 确定 一 个 特定 进程 是 否 仍然 存在 。 如 果 向 一 个 并 不 存在 的 进程 发 送 空 
信号 ， 则 kill 返回 -1，errno 被 设置 为 ESRCH。 但 是 ， 应 当 注 意 ，UNIX 系统 在 经 过 一 定时 间 
后 会 重新 使 用 进程 ID, 所 以 一 个 现 有 的 具有 所 给 定 进程 ID 的 进程 并 不 一 定 就 是 你 所 想 要 的 进程 。 

还 应 理解 的 是 , 测试 进程 是 否 存在 的 操作 不 是 原子 操作 。 在 kill 向 调用 者 返回 测试 结果 时 ， 
原来 已 存在 的 被 测试 进程 此 时 可 能 已 经 终止 ， 所 以 这 种 测试 并 无 多 大 价值 。 

如 果 调 用 kill 为 调用 进程 产生 信号 ， 而 且 此 信号 是 不 被 阻塞 的 ， 那 么 在 kill 返回 之 前 ， 
signo 或 者 某 个 其 他 未 决 的 、 非 阻塞 信号 被 传送 至 该 进程 。( 对 于 线程 而 言 ， 还 有 一 些 附 加 条 件 ; 
详细 情况 见 12.8 节 。) 


10.10 PAR alarm ffl pause 


使 用 alarm 函数 可 以 设置 一 个 定时 器 《闹钟 时 间 )， 在 将 来 的 某 个 时 刻 该 定时 器 会 超时 。 当 
定时 器 超时 时 ， 产 生 SIGALRM 信号 。 如 果 忽 略 或 不 捕捉 此 信号， 则 其 默认 动作 是 终止 调用 该 
alarm 函数 的 进程 。 


#include «unistd.h» 


unsigned int alarm(unsigned int seconds); 





参数 seconds 的 值 是 产生 信号 SIGALRM 需要 经 过 的 时 钟 秒 数 。 当 这 一 时 刻 到 达 时 ,信号 由 内 

核 产生 ， 由 于 进程 调度 的 延迟 ， 所 以 进程 得 到 控制 从 而 能 够 处 理 该 信号 还 需要 一 个 时 间 间 隔 。 
早期 的 UNIX 系统 实现 曾 提 出 警告 , 这 种 信号 可 能 比 预 定 值 提前 1s Rik, POSIX.] 则 不 允许 

每 个 进程 只 能 有 一 个 闹钟 时 间 。 如 果 在 调用 alarm 时 ， 之 前 已 为 该 进程 注册 的 闹钟 时 间 还 没有 超 
时 ， 则 该 闹钟 时 间 的 余 留 值 作为 本 次 alarm 函数 调用 的 值 返回 。 以 前 注册 的 闹钟 时 间 则 被 新 值 代 符 。 

如 果 有 以 前 注册 的 尚未 超过 的 闹钟 时 间 , 而 且 本 次 调用 的 seconds 值 是 0, 则 取消 以 前 的 闹钟 
时 间 ， 其 余 留 值 仍 作为 alarm 函数 的 返回 值 。 

虽然 SIGALRM 的 默认 动作 是 终止 进程 ， 但 是 大 多 数 使 用 闹钟 的 进程 捕捉 此 信号 。 如 果 此 时 
进程 要 终止 ， 则 在 终止 之 前 它 可 以 执行 所 需 的 清理 操作 。 如 果 我 们 想 捕捉 SIGALRM 信号 ， 则 必 
须 在 调用 alarm 之 前 安装 该 信号 的 处 理 程序 。 如 果 我 们 先 调用 alarm， 然 后 在 我 们 能 够 安装 
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SIGALRM 处 理 程序 之 前 已 接 到 该 信号 ， 那 么 进程 将 终止 。 
pause 函数 使 调用 进程 挂 起 直至 捕捉 到 一 个 信号。 


$include «unistd.h» 


int pause(void); 





BRE: -1, errno 设置 为 EINTR | |338 


只 有 执行 了 一 个 信号 处 理 程序 并 从 其 返回 时 ，pause 才 返 回 。 在 这 种 情况 下 ，Pause 返回 -1， 
errno 设置 为 EINTR。 


使 用 alarm fl pause, 进程 可 使 自己 休眠 一 段 指 定 的 时 间 。 图 10-7 中 的 sleep] 函数 看 似 
提供 了 这 种 功能 (其 实 这 里 面 存 在 问题 ， 我 们 很 快 就 会 看 到 )。 


#include <signal.h> 
#include <unistd.h> 


static void 
sig_alrm(int signo) 
{ 
/* nothing to do, just return to wake up the pause */ 


} 


unsigned int 
sleepl (unsigned int seconds) 
{ 


if (signal (SIGALRM, sig alrm) == SIG ERR) 
return (seconds) ; 
alarm(seconds); /* start the timer */ 
pause ():; /* next caught signal wakes us up */ 
return(alarm(0)); /* turn off timer, return unslept time */ 


图 10-7 sleep 简化 而 不 完整 的 实现 


程序 中 的 sleep] 函数 看 起 来 与 将 在 10.19 节 中 说 明 的 sleep 函数 类 似 , 但 这 种 简单 实现 有 
以 下 3 个 问题 。 

CD 如 果 在 调用 sleep] Zi, HHACKRE SMP, WER sleep] 函数 中 的 第 一 次 alarm 
调用 控 除 。 可 用 下 列 方法 更 正 这 一 点 : 检查 第 一 次 调用 alarm 的 返回 值 ， 如 其 值 小 于 本 次 调用 
alarm 的 参数 值 ， 则 只 应 等 到 已 有 的 闹钟 超时 。 如 果 之 前 设置 的 闹钟 超时 时 间 晚 于 本 次 设置 值 ， 
则 在 sleep] 函数 返回 之 前 ， 重 置 此 闹钟 ， 使 其 在 之 前 前 钟 的 设 定时 间 再 次 发 生 超时 。 

(2) 该 程序 中 修改 了 对 SIGALRM 的 配置 。 如 果 编 写 了 一 个 函数 供 其 他 函数 调用 ， 则 在 该 函 
数 被 调用 时 先 要 保存 原配 置 , 在 该 函数 返回 前 再 恢复 原配 置 . 更正 这 一 点 的 方法 是 : 保存 signal 
溺 数 的 返回 值 ， 在 返回 前 重 置 原配 置 。 

(3) 在 第 一 次 调用 alarm 和 pause 之 间 有 一 个 竞争 条 件 。 在 一 个 繁忙 的 系统 中 ， 可 能 alarm 
在 调用 pause 之 前 超时 ， 并 调用 了 信和 号 人 处理 程序 。 如 果 发 生 了 这 种 情况 ， 则 在 调用 pause 后， 
如 果 没 有 捕捉 到 其 他 信号 ， 调 用 者 将 永远 被 挂 起 。 339 

sleep 的 早期 实现 与 图 10-7 程序 类 似 ， 但 更 正 了 第 1 个 和 第 2 个 问题 。 有 两 种 方法 可 以 更 正 第 
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3 个 问题 。 第 一 种 方法 是 使 用 set jmp. 下 一 个 实例 将 说 明 这 种 方法 。 另 一 种 方法 是 使 用 sigprocask 
和 sigsuspend, 10.19 节 将 说 明 这 种 方法 。 "B 


Fa 实例 


SVR2 中 的 sleep 实现 使 用 了 setjmp 和 longjmp( 见 7.10 节 )， 以 避免 前 一 个 实例 的 第 3 
个 问题 中 说 明 的 竟 争 条 件 。 此 函数 的 一 个 简化 版 本 称 为 sleep2， 示 于 图 10-8 中 (为 了 缩短 实例 
程序 的 长 度 ， 程 序 中 没有 处 理 上 面 所 说 的 第 1 个 和 第 2 个 问题 )。 


#include <setjmp.h> 
#include <signal.h> 
#include <unistd.h> 
static jmp_buf env_alrm; 


Static void 
Sig_alrm(int signo) 
{ 
longjmp({env_alrm, 1); 


! 


unsigned int 
sleep2 (unsigned int seconds) 
{ 


if (signal (SIGALRM, sig_alrm) == SIG ERR) 
return (seconds) ; 
if (setjmp(env_alrm) == 0) { 
alarm(seconds) ; /* start the timer */ 
pause (); /* next caught signal wakes us up */ 
} 
return (alarm(0)); /* turn off timer, return unslept time */ 


10-8 sleep 的 另 一 个 不 完善 的 实现 

ER, CRA TE 10-7 中 具有 的 竞争 条 件 。 即 使 pause 从 未 执行 ， 在 发 生 SIGALRM 
时 ，sleep2 函数 也 返回 。 

但 是 ，sleep2 函数 中 却 有 男 一 个 难以 察觉 的 问题 , 它 涉 及 与 其 他 信号 的 交互 。 如果 SIGALRM 
中 汤 了 某 个 其 他 信号 处 理 程序 ， 则 调用 1ongjmp 会 提早 终止 该 信号 处 理 程序 。 图 10-9 显示 了 这 
种 情况 。SIGINT 处 理 程序 中 包含 了 for 循环 语句 ， 它 在 作者 所 用 系统 上 的 执行 时 间 超 过 5s, th 
就 是 大 于 sleep2 的 参数 值 ， 这 正 是 我 们 想 要 的 。 整 型 变量 k 说 明 为 volatile， 这 样 就 阻止 了 

优化 编译 程序 去 除 循环 语句 。 


#include "apue.h" 


unsigned int Sleep2 (unsigned int); 
static void sig_int (int); 
int 


main (void) 
{ 
unsigned int unslept; 
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if (signal(SIGINT, sig int) == SIG ERR) 
err sys("signal(SIGINT) error"); 
unslept - sleep2(5); 
printf("sleep2 returned: %u\n", unslept); 
exit (0); 
} 


static void 
sig_int{int signo) 
{ 


int ly JF 
volatile int k; 
/* 


* Tune these loops to run for more than 5 seconds 

* on whatever system this test program is run. 

*y 
printf("Mnsig int startingMn"); 
for (i = 0; i « 300000; i++) 

for (j = 0; j < 4000; j++) 
k *-i* ji 

printf("sig int finished\n"); 


10-9 ”在 一 个 捕 提 其 他 信和 号 的 程序 中 调用 sleep2 
执行 图 10-9 中 的 程序 ， 可 以 通过 键入 中 断 字 符 来 中 断 休 眼 ， 运 行 结果 如 下 : 
$ ./a.out 
^C 键入 中 断 字符 


sig int starting 
sleep2 returned: 0 


从 中 可 见 sleep2 函数 所 引起 的 Longjmp 使 另 一 个 信和 号 处 理 程序 sig int 提早 终止 ， 即 使 它 未 
完成 也 会 如 此 。 如 果 将 SVR2 的 sleep 函数 与 其 他 信号 处 理 程序 一 起 使 用 ， 就 可 能 碰 到 这 种 情况 。 
见习 题 10.3。 m 


sleepl 和 sleep2 函数 的 这 两 个 实例 是 告诉 我 们 在 涉及 信号 时 需要 有 精细 而 周到 的 考虑 。 下 面 
几 节 将 说 明 解 决 这 些 问题 的 方法 ， 使 我 们 能 够 可 靠 地 、 在 不 影响 其 他 代码 段 的 情况 下 处 理 信号 。 


-时 实例 

除了 用 来 实现 sleep 函数 外 ，alarm 还 常用 于 对 可 能 阻塞 的 操作 设置 时 间 上 限 值 。 例 如 ， 
程序 中 有 一 个 读 低 速 设备 的 可 能 阻塞 的 操作 ( 见 10.5 节 )， 我 们 希望 超过 一 定时 间 量 后 就 停止 执 
行 该 操作 。 图 10-10 实现 了 这 一 点 ， 它 从 标准 输入 读 一 行 ， 然 后 将 其 写 到 标准 输出 上 。 


#include "apue.h" 
static void sig alrm(int); 


int 
main(void) 
{ 
int n; 
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char Line [MAXLINE] ; 


if (signal {SIGALRM, sig alrm) == SIG ERR) 
err sys("signal(SIGALRM) error"); 


alarm(10); 

if ((n = read(STDIN_FILENO, line, MAXLINE)) < 0) 
err_sys ("read error"); 

alarm(0); 


write(STDOUT FILENO, line, n); 
exit(0); 
} 


Static void 
sig_alrm(int signo) 


{ 
/* nothing to do, just return to interrupt the read */ 


) 
10-10” 带 时 间 限 制 调用 read 

这 种 代码 序列 在 很 多 UNIX 应 用 程序 中 都 能 见 到 ， 但 是 这 种 程序 有 两 个 问题 : 

(1) 图 10-10 中 的 程序 具有 与 图 10-7 中 的 程序 相同 的 问题 ， 在 第 一 次 alarm 调用 和 read 
调用 之 间 有 一 个 竞争 条 件 。 如 果 内 核 在 这 两 个 毅 数 调用 之 间 使 进程 阻塞 ， 不 能 占用 处 理 机 运行 ， 
而 其 时 间 长 度 又 超过 闲 钟 时 间 ， 则 read 可 能 永远 阻塞 。 大 多 数 这 种 类 型 的 操作 使 用 较 长 的 闹钟 
时 间 ， 例 如 1 分 钟 或 更 长 一 点 ， 使 这 种 问题 不 会 发 生 ， 但 无 论 如 何 这 是 一 个 竞争 条 件 。 

(2) 如 果 系 统 调用 是 自动 重启 动 的 ， 则 当 从 SIGALRM 信号 处 理 程序 返回 时 ，read 并 不 被 中 

断 。 在 这 种 情形 下 ， 设 置 时 间 限 制 不 起 作用 。 


E 


在 这 里 我 们 确实 需要 中 断 慢 速 系统 调用 。 我 们 将 在 10.14 节 对 此 进行 详细 讨论 。 a 
Fg BA 


让 我 们 用 longjmp 再 实现 前 面 的 实例 。 使 用 这 种 方法 无 需 担心 一 个 慢 速 的 系统 调用 是 否 被 
中 断 ， 见 图 10-11. 


finclude "apue.h" 
#include <setjmp.h> 


Static void sig alrm(int); 
static jmp buf env alrm; 
int 


main(void) 
{ 


int n; 

char line [MAXLINE]; 

if (signal (SIGALRM, sig alrm) == SIG ERR) 
err_sys ("signal (SIGALRM) error"); 

if (setjmp(env alrm) != 0) 


err quit("read timeout"); 
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alarm(10); 

if ((n = read(STDIN FILENO, line, MAXLINE)) < 0) 
err sys("read error"); 

alarm(0); 


write(STDOUT FILENO, line, n); 
exit(0); 
} 


static void 
sig alrm(int signo) 
{ 
longjmp(env alrm, 1); 
) 


图 10-11 使 用 longjmp， 带 时 间 限 制 调用 read 
不 管 系统 是 否 重新 启动 被 中 断 的 系统 调用 ， 该 程序 都 会 如 所 预期 的 那样 工作 。 但 是 要 知道 ， 
该 程序 仍旧 有 和 图 10-8 中 的 程序 相同 的 与 其 他 信号 处 理 程序 交互 的 问题 。 "n 
如 果 要 对 UO 操作 设置 时 间 限 制 ， 则 如 上 所 示 可 以 使 用 longjmp， 当 然 也 要 清楚 它 可 能 有 与 
其 他 信号 处 理 程序 交互 的 问题 。 另 一 种 选择 是 使 用 select Mpoll 函数 ，14.4.1 节 和 14.4.2 节 
将 对 它们 进行 说 明 。 


10.11 ”信和 号 集 


我 们 需要 有 一 个 能 表示 多 个 信和 号 一 一 信号 集 (signal set) 的 数据 类 型 。 我 们 将 在 sigprocmask 
(下 一 节 中 说 明 ) 类 函数 中 使 用 这 种 数据 类 型 ， 以 便 告 诉 内 核 不 允许 发 生 该 信号 集中 的 信号 。 如 
前 所 述 ， 不 同 的 信和 号 的 编号 可 能 超过 一 个 整 型 量 所 包含 的 位 数 ， 所 以 一 般 而 言 ， 不 能 用 整 型 量 中 
的 一 位 代表 一 种 信号 ， 也 就 是 不 能 用 一 个 整 型 量 表示 信号 集 。POSIX.1 定义 数据 类 型 sigset_t 
以 包含 一 个 信号 集 ， 并 且 定 义 了 下 列 5 个 处 理 信号 集 的 函数 。 

#include <signal.h> 

int sigemptyset(sigset t *sel); 

int sigfillset(sigset t *set); 

int sigaddset(sigset t *set, int signo); 


int sigdelset(sigset t * set, int signo); 


4 个 函数 返回 值 : 若 成 功 ， 返 回 0: 若 出 错 ， 返 回 -1 


int sigismember(const sigset t *sef, int signo); 





返回 值 : HHA, Beli; #6, Belo 

函数 sigemptyset 初始 化 由 set TRIS E) fei S8, THER LR PUB fS. AM sigfillset 9 

始 化 由 ser 指向 的 信号 集 ， 使 其 包括 所 有 信号 。 所 有 应 用 程序 在 使 用 信和 号 集 前 ， 要 对 该 信号 集 调 

用 sigemptyset 或 sigfillset 一 次 。 这 是 因为 C 编译 程序 将 不 赋 初 值 的 外 部 变量 和 静态 变 
量 都 初始 化 为 0， 而 这 是 否 与 给 定 系统 上 信和 号 集 的 实现 相对 应 却 并 不 清楚 。 

一 旦 已 经 初始 化 了 一 -个 信号 集 ， 以 后 就 可 在 该 信号 集中 增 、 删 特定 的 信号 。 函 数 sigaddset 
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将 一 个 信和 号 添加 到 已 有 的 信号 集中 ，sigdelset 则 从 信号 集中 删除 一 个 信号 。 对 所 有 以 信号 集 
作为 参数 的 函数 ， 总 是 以 信号 集 地 址 作为 向 其 传送 的 参数 。 


Pes. 


如 果实 现 的 信号 数目 少 于 一 个 整 型 量 所 包含 的 位 数 ， 则 可 用 一 位 代表 一 个 信号 的 方法 实现 信和 号 集 。 
例如 , 本 书 的 后 续 部 分 都 假定 一 种 实现 有 31 种 信号 和 32 位 整 型 。sigemptyset 函数 将 整 型 设置 为 0， 
sigfillset 函数 则 将 整 型 中 的 各 位 都 设置 为 1。 这 两 个 函数 可 以 在 <signal .h> 头 文件 中 实现 为 宏 : 


0) 
~{sigset_t)0, 0) 


注意 ， 除 了 设置 信号 集中 各 位 为 1 外 ，sigfillset 必须 返回 0， 所 以 使 用 C 语言 的 逗号 算 符 ， 
它 将 逗号 算 符 后 的 值 作为 表达 式 的 值 返 回 。 

使 用 这 种 实现 ，sigaddqset 开启 一 位 (将 该 位 设置 为 1 )，sigdelset 则 关闭 一 位 (将 该 
位 设置 为 0)，sigismember 测试 一 个 指定 的 位 。 因 为 没有 信和 号 编号 为 0， 所 以 从 信和 号 编号 中 减 


#define sigemptyset(ptr) (* (ptr) 
#define sigfillset (ptr) (* (ptr) 


| 以 得 到 要 处 理 位 的 位 编号 数 。 图 10-12 给 出 了 这 些 函 数 的 实现 。 


finclude <signal.h> 

#include <errno.h> 

/* 

* <signal.h> usually defines NSIG to include signal number 0. 
*/ 

#define SIGBAD(signo)((signo) <= 0 || (signo) >= NSIG) 

int 


sigaddset(sigset t *set, int signo) 
i 
if (SIGBAD(signo)) { 
errno = EINVAL; 
return(-1); 
} 
*set |= 1 << (signo - 1); /* turn bit on */ 
return {0); 


} 


int 
sigdelset(sigset t *set, int signo) 
{ 
if (SIGBAD(signo)) { 
errno = EINVAL; 
return{-1)? 
} 
*set &= -(1 << (signo - 1)):; /* turn bit off */ 
return(0); 


} 


int 
sigismember (const sigset t *set, int signo) 
{ 
if (SIGBAD(signo)) { 
errno = EINVAL; 
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return (-1l); 
} 


return((*set & (1 << (signo - 1))) != 0); 


10-12 sigaddset. sigdelset 和 sigismember 的 实现 


也 可 将 这 3 个 函数 在 <signal .h> 中 实现 为 各 一 行 的 宏 , 但 是 POSIX.1 要 求 检查 信和 号 编号 参 
数 的 有 效 性 ， 如 果 无 效 则 设置 errno。 在 宏 中 实现 这 一 点 比 函 数 要 难 。 [345] 


10.12 函数 sigprocmask 


10.8 节 曾 提 及 一 个 进程 的 信号 屏蔽 字 规定 了 当前 阻塞 而 不 能 递送 给 该 进程 的 信号 集 。 调 用 函 
数 sigprocmask 可 以 检测 或 更 改 ， 或 同时 进行 检测 和 更 改进 程 的 信号 屏蔽 字 。 


#include <signal.h> 


int sigprocmask(int how, const sigset t *restrict sef, sigset t *restrict osef); 
返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
首先 ， 若 oset 是 非 空 指针 ， 那 么 进程 的 当前 信号 屏蔽 字 通 过 oser 返回 。 
其 次 ， 若 set 是 一 个 非 空 指针 ， 则 参数 how 指示 如 何 修改 当前 信号 屏蔽 字 。 图 10-13 说 明了 
how 可 选 的 值 。SIG_BLOCK 是 或 操作 ， 而 SIG SETMASK 则 是 赋值 操作 。 注 意 ， 不 能 阻塞 SIGKILL 
和 SIGSTOP fas. 





SIG BLOCK 该 进程 新 的 信号 屏蔽 字 是 其 当前 信号 屏 珊 字 和 ser 指向 信号 集 的 并 集 。set AST AH 
望 阻塞 的 附加 信和 号 


SIG UNBLOCK 该 进程 新 的 信号 屏蔽 字 是 其 当前 信号 屏蔽 字 和 ser 所 指向 信号 集 补 集 的 交集 。set 包 
含 了 希望 解除 阻塞 的 信号 
SIG SETMASK 该 进程 新 的 信号 屏蔽 是 ser 指向 的 值 





图 10-13 用 sigprocmask 更 改 当 前 信号 屏蔽 字 的 方法 
如 果 ser 是 个 空 指针 ， 则 不 改变 该 进程 的 信号 屏蔽 字 ，how 的 值 也 无 意义 。 
在 调用 sigprocmask 后 如 果 有 任何 未 决 的 、 不 再 阻塞 的 信号 ， 则 在 sigprocmask 返回 前 ， 
至 少将 其 中 之 一 递送 给 该 进程 。 
| sigprocmask 是 仅 为 单线 程 进 程 定义 的 。 处 理 多 线程 进程 中 信号 的 屏蔽 使 用 另 一 个 通 数 。 
:我们 将 在 12.8 节 中 对 此 进行 讨论 。 


FESI 
图 10-14 程序 是 一 个 函数 , 它 打印 调用 进程 信和 与 屏蔽 字 中 的 信号 名 。 图 10-20 中 的 程序 和 图 10-22 
中 的 程序 将 调用 此 函数 。 [346] 


#include "apue.h" 
#include <errno.h> 


void 
pr_mask(const char *str} 
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sigset t sigset; 
int errno save; 


errno save - errno; /* we can be called by signal handlers */ 
if (sigprocmask(0, NULL, &sigset) < 0) { 
err ret("sigprocmask error"); 
} else { 
printf("%s", str); 
if (sigismember(&sigset, SIGINT)) 
printf(" SIGINT"); 
if (sigismember(&sigset, SIGQUIT)) 
printf(" SIGQUIT"); 
if (sigismember(&sigset, SIGUSR1)) 
printf(" SIGUSR1"); 
if (sigismember(&sigset, SIGALRM)) 
printf(" SIGALRM"); 


/* remaining signals can go here */ 


printf ("Nn"); 


errno = errno save; /* restore errno */ 


10-14 ”为 进程 打印 信号 屏蔽 字 
为 了 节省 空间 ， 没 有 对 图 10-1 中 列 出 的 每 一 种 信号 测试 该 屏蔽 字 〔 见 习题 10.9)。 " 
10.13 函数 sigpending 


sigpending 函数 返回 一 信号 集 ， 对 于 调用 进程 而 言 ， 其 中 的 各 信号 是 阻塞 不 能 递送 的 ， 因 
而 也 一 定 是 当前 未 决 的 。 该 信号 集 通过 set 参数 返回 。 


#include <signal.h> 


int sigpending(sigset t *ser); 


返回 值 ， 若 成功， 返回 0， 若 出 错 ， 返 回 -1 





里 实例 
图 10-15 展示 了 很 多 前 面 说 明 过 的 信号 功能 。 
#include "apue.h" 
static void sig quit(int); 
int 
main(void) 
{ 


sigset t newmask, oldmask, pendmask; 


if (signal(SIGQUIT, sig quit) -- SIG ERR) 
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err_sys("can't catch SIGQUIT"); 


/* 
* Block SIGQUIT and save current signal mask. 
*/ 
sigemptyset (&newmask) ; 
sigaddset(&newmask, SIGQUIT); 
if (sigprocmask(SIG BLOCK, &newmask, &oldmask) < 0) 
err sys("SIG BLOCK error"); 


sleep(í5); /* SIGQUIT here will remain pending */ 


if (sigpending(&pendmask) < O0) 
err sys("sigpending error"); 

if (sigismember(&pendmask, SIGQUIT)) 
printf("MnSIGQUIT pendingMn"); 


/* 
* Restore signal mask which unblocks SIGQUIT. 
AJ 
if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err Sys("SIG SETMASK error"); 
printf("SIGQUIT unblocked\n"); 


sleep(5); /* SIGQUIT here will terminate with core file */ 
exit(0); 
} 


static void 
sig_quit (int signo) 
{ 
printf ("caught SIGQUIT\n") ; 
if (signal(SIGQUIT, SIG_DFL) == SIG_ERR) 
err sys("can't reset SIGQUIT"); 


10-15 ”信和 号 设置 和 sigprocmask 实例 

进程 阻塞 SIGQUIT 信和 号， 保存 了 当前 信号 屏蔽 字 〈 以 便 以 后 恢复 )， 然 后 休眠 5 秒 。 在 此 期 
间 所 产生 的 退出 信和 号 SIGQUIT 都 被 阻塞 ， 不 递送 至 该 进程 ， 直 到 该 信号 不 再 被 阻塞 。 在 S 秒 休 
眠 结束 后 ， 检 查 该 信号 是 否 是 未 决 的 ， 然 后 将 SIGQUIT 设置 为 不 再 阻塞 。 

注意 ， 在 设置 SIGQUIT 为 阻塞 时 ， 我 们 保存 了 老 的 屏蔽 字 。 为 了 解除 对 该 信号 的 阻塞 ， 用 
老 的 屏蔽 字 重 新 设置 了 进程 信号 屏蔽 字 (SIG_SETMASK)。 另 一 种 方法 是 用 SIG_UNBLOCK 使 阻 
塞 的 信号 不 再 阻塞 。 但 是 ， 应 当 了 解 如 果 编 写 一 个 可 能 由 其 他 人 使 用 的 函数 ， 而 且 需 要 在 函数 中 
阻塞 一 个 信号 ， 则 不 能 用 SIG_UNBLOCK 简单 地 解除 对 此 信和 号 的 阻塞 ， 这 是 因为 此 函数 的 调用 者 
在 调用 本 函数 之 前 可 能 也 阻塞 了 此 信号 。 在 这 种 情况 下 必须 使 用 SIG SETMASK 将 信和 号 屏蔽 字 恢 
复 为 先前 的 值 ， 这 样 也 就 能 继续 阻塞 该 信号 。10.18 HJ system 函数 部 分 有 这 样 的 一 个 例子 。 

在 休眠 期 间 如 果 产 生 了 退出 信号 ， 那 么 此 时 该 信号 是 未 决 的， 但 是 不 再 受阻 塞 ， 所 以 在 
sigprocmask 返回 之 前 ， 它 被 递送 到 调用 进程 。 从 程序 的 输出 中 可 以 看 到 这 一 点 : SIGQUIT 处 
理 程序 (sig quit) PA printf 语句 先 执行 , 然后 再 执行 sigprocmask 之 后 的 printf 语句 。 

然后 该 进程 再 休眠 5 秒 。 如 果 在 此 期 间 再 产生 退出 信号 ， 那 么 因为 在 上 次 捕捉 到 该 信号 时 ， 


Uu 
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已 将 其 处 理 方式 设置 为 默认 动作 ， 所 以 这 一 次 它 就 会 使 该 进程 终止 。 在 下 列 输 出 中 ， 当 我 们 在 终 
端 键入 退出 字符 Ctrl+ 时， 终端 打印 ^ 人 《终端 退出 字符 )， 


$ ./a.out 

ay 产生 信号 一 次 {在 5s 之 内 ) 
SIGQUIT pending 从 sleep 返回 后 

caught SIGQUIT 在 信号 处 理 程 序 中 
SIGQUIT unblocked 从 sigprocmask 返回 后 
“\Quit (coredump) 再 次 产生 信号 

$ ./a.out 

ARONA AAA AAA 产生 信号 10 次 (在 5s 之 内 ) 


SIGQUIT pending 


caught SIGQUIT 只 产生 信和 号 一 次 


SIGQUIT unblocked 


^NXQuit (coredump) 再 产生 信和 号 

shell 发 现 其 子 进程 异常 终止 时 输出 QUIT (coredump) 信息 。 注 意 ， 第 二 次 运行 该 程序 时 ， 
在 进程 休眠 期 间 使 SIGQUIT 信号 产生 了 10 次 , 但 是 解除 了 对 该 信号 的 阻塞 后 ， 只 癌 进 程 传送 一 
次 SIGQUIT。 从 中 可 以 看 出 在 此 系统 上 没有 将 信号 进行 排队 。 a 


10.14 PAR sigaction 


sigaction 函数 的 功能 是 检查 或 修改 〈 或 检查 并 修改 ) 与 指定 信号 相关 联 的 处 理 动作 。 此 项 
数 取 代 了 UNIX 早期 版 本 使 用 的 signal 函数 。 在 本 节 末 尾 用 sigaction 函数 实现 了 signal. 


#include <signal.h> 


int sigaction(int signo, const struct sigaction *restrict act, 
struct sigaction *restrict oact); 





返回 值 ， Heh. blo; FER, le- 


其 中 ， 参 数 signo 是 要 检测 或 修改 其 具体 动作 的 信号 编号 。 若 ac 指针 非 空 ， 则 要 修改 其 动作 。 
如 果 oact 指针 非 空 ， 则 系统 经 由 oact 指针 返回 该 信号 的 上 一 个 动作 。 此 函数 使 用 下 列 结构 : 


struct sigaction { 


void (*sa handler) (int); /* addr of signal handler, */ 

/* or SIG_IGN, or SIG_DFL */ 
sigset_t sa_mask; /* additional signals to block */ 
int sa flags; /* signal options, Figure 10.16 */ 
/* alternate handler */ 
void (*sa sigaction) (int, siginfo t *, void *); 


}; 


当 更 改 信号 动作 时 ， 如 果 sa handler 字段 包含 一 个 信号 捕捉 函数 的 地 址 (不 是 常量 
SIG_IGN 或 SIG_DFL)， 则 sa mask 字段 说 明了 一 个 信号 集 ， 在 调用 该 信号 捕捉 函数 之 前 ， 这 
一 信和 号 集 要 加 到 进程 的 信号 屏蔽 字 中 。 仅 当 从 信和 号 捕捉 函数 返回 时 再 将 进程 的 信号 屏蔽 字 恢 复 为 
原先 值 。 这 样 ， 在 调用 信和 号 处 理 程序 时 就 能 阻塞 某 些 信号 。 在 信和 号 处 理 程序 被 调用 时 ， 操 作 系统 
建立 的 新 信号 屏蔽 字 包 括 正 被 递送 的 信和 号。 因此 保证 了 在 处 理 一 个 给 定 的 信号 时 ， 如 果 这 种 信和 号 
再 次 发 生 ， 那 么 它 会 被 阻塞 到 对 前 一 个 信号 的 处 理 结束 为 止 。 回 忆 10.8 节 ， 若 同一 种 信号 多 次 发 
生 ， 通 常 并 不 将 它们 加 入 队列 ， 所 以 如 果 在 某 种 信号 被 阻塞 时 ， 它 发 生 了 5 次 ， 那 么 对 这 种 信号 
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解除 阻塞 后 ， 其 信号 处 理 函 数 通 常 只 会 被 调用 一 次 (上 一 个 例子 已 经 说 明了 这 种 特性 )。 


一 旦 对 给 定 的 信号 设置 了 一 个 动作 ， 那 么 在 调用 sigaction 显 式 地 改变 它 之 前 ， 


一 直 有 效 。 这 种 处 理 方式 与 早期 的 不 可 靠 信号 机 制 不 同 ， 


act 结构 的 sa flags 字段 指定 对 信号 进行 处 理 的 各 个 选项 。 图 10-16 详细 列 出 了 这 些 选 项 
的 意义 。 著 该 标志 已 定义 在 基本 POSIX.1 标准 中 ， 那 么 SUS WAZ “+”; 


POSIX.1 标准 的 XSI 扩展 中 ， 那 么 该 列 包含 “XSI”。 


pra Linux Mac OS rd 
3.2.0 X 10.6.8 


sa INTERRUPT | — | 


SA NOCLDSTOP 


SA NOCLDWAIT 


SA NODEFER 


SA ONSTACK 


SA RESETHAND 


SA RESTART 


SA SIGINFO 


10-16 “处理 每 个 信号 的 可 选 标志 
sa sigaction 字段 是 一 个 替代 的 信号 处 理 程序 ， 在 sigaction 结构 中 使 用 了 SA SIGINFO 
标志 时 ， 使 用 该 信号 处 理 程序 。 对 于 sa sigaction 字段 和 sa nandler 字段 两 者 ， 实 现 可 能 


合 POSIX.1 在 这 方面 的 要 求 。 


由 此 信和 号 中 断 的 系统 调用 不 自动 重启 | 自动 重启 
动 (XSI 对 于 sigaction 的 默认 处 理 方 
3. TEN 10.5 节 

车 signo 是 SIGCHLD, 当 子 进程 停止 ( 作 
业 控 制 )， 不 产生 此 信号 。 当 子 进程 终止 
时 ， 仍 旧 产 生 此 信号 《但 请 参阅 下 面 说 
HAE) SA_NOCLDWAIT 选项 )。 若 已 设置 
此 标志 ， 则 当 停 止 的 进程 继续 运行 时 ， 
作为 XSI 扩展， 不 产生 SIGCHLD 信号 

车 signo 是 STGCHLD， 则 当 调 用 进程 
WTHR EH., ARI. # 
调用 进程 随后 调用 wait， 则 阻塞 到 它 所 
有 子 进 程 都 终止 ， 此 时 返回 -1，、，errno 
设置 为 ECHILD (M, 10.7 节 ) 

当 捕 捉 到 此 信号 时 ， 在 执行 其 信和 号 捕 
捉 函 数 时 ， 系 统 不 自动 阻塞 此 信号 〈 除 
非 sa mask 包括 了 此 信号 )。 注 意 ， 此 
种 类 型 的 操作 对 应 于 早期 的 不 可 靠 信号 

XH sigaltstack(2) 已 声明 了 一 个 
替换 栈 ， 则 此 信和 号 递送 给 替换 栈 上 的 进程 

在 此 信号 捕捉 函数 的 入 口 处 ， 将 此 信和 号 
的 处 理 方式 重 置 为 SIG_DFL， 并 清除 
SA SIGINFO 标志 。 注 意 ， 此 种 类 型 的 信 
号 对 应 于 早期 的 不 可 靠 信和 号。 但 是 ， 不 能 
ELSE. SIGILL 和 SIGTRAP 这 两 个 信 
号 的 配置 。 设 置 此 标志 使 sigaction 的 
行为 如 同 设 置 了 SA_NODEFER 标志 

由 此 信号 中 靳 的 系统 调用 自动 重启 动 
(参见 10.5 $5) 

此 选项 对 信和 号 处 理 程 序 提供 了 附加 信 
息 : 一 个 指向 siginfo 结构 的 指针 以 及 
一 个 指向 进程 上 下 文 标识 符 的 指针 





(sa flags) 


使 用 同一 存储 区 ， 所 以 应 用 只 能 一 次 使 用 这 两 个 字段 中 的 一 个 。 


通常 ， 按 下 列 方式 调用 信号 处 理 程序 : 


void handler(int sigmo); 


但 是 ， 如 果 设 置 了 SA_SIGINFO 标志 ， 那 么 按 下 列 方式 调用 信号 处 理 程 序 ; 


void handler(int signo, siginfo t *imfo, void *context); 


该 设置 就 


老 该 标志 定义 在 基本 


350 
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siginfo 结构 包含 了 信号 产生 原因 的 有 关 信 息 。 该 结构 的 大 致 样式 如 下 所 示 。 符 合 POSIX.1 的 
所 有 实现 必须 至 少 包括 si_signo 和 si_code MR. AS, IFE XSI 的 实现 至 少 应 包含 下 列 字段 : 


struct siginfo { 


int si signo;  /* signal number */ 

int si errno;  /* if nonzero, errno value from «errno.h» */ 
int si code; /* additional info (depends on signal) */ 
pid t si pid; /* sending process ID */ 

uid t si uid; /* sending process real user ID */ 

void *si addr; /* address that caused the fault */ 

int si status; /* exit value or signal number */ 


union sigval si value;  /* application-specific value */ 
/* possibly other fields also */ 
} ; 


sigval 联合 包含 下 列 字 段 : 


int  sival int; 
void *sival, ptr; 


应 用 程序 在 递送 信号 时 ， 在 si value.sival int 中 传递 一 个 整 型 数 或 者 在 si value.sival ptr 
中 传递 一 个 指针 值 。 

10-17 示 出 了 对 于 各 种 信号 的 si_code 值 ， 这 些 信 号 是 由 Single UNIX Specification 定义 
的 。 注 意 ， 实 现 可 定义 附加 的 代码 值 。 

若 信 号 是 SIGCHLD, WHEE si_pid、si_status 和 si_uid 字段 。 若 信号 是 SIGBUS. 
SIGILL, SIGFPE 或 SIGSEGV， 则 si_addr 包含 造成 故障 的 根源 地 址 ， 该 地 址 可 能 并 不 准确 。 
si errno 字段 包含 错误 编号 ， 它 对 应 于 造成 信号 产生 的 条 件 ， 并 由 实现 定义 。 

信号 处 理 程序 的 context 参数 是 无 类 型 指针 , 它 可 被 强制 类 型 转换 为 ucontext_t 结构 类 型 ， 
该 结构 标识 信号 传递 时 进程 的 上 下 文 。 该 结构 至 少 包含 下 列 字 段 : 


ucontext t *uc link; /* pointer to context resumed when */ 
/* this context returns */ 

sigset t uc sigmask; /* signals blocked when this context */ 
/* is active */ 

stack t uc stack; /* stack used by this context */ 


mcontext t uc mcontext; /* machine-specific representation of */ 
/* saved context */ 


uc stack 字段 描述 了 当前 上 下 文 使 用 的 栈 ， 至 少 包括 下 列 成 员 : 


void *ss_sp; /* stack base or pointer */ 
size t ss size; /* stack size */ 
int ss flags; /* flags */ 


当 实 现 支持 实时 信号 扩展 时 ,用 SA SIGINFO 标志 建立 的 信号 处 理 程序 将 造成 信号 可 靠 地 排 
: 队 。 一 些 保留 信号 可 由 实时 应 用 使 用 。 如 果 信 号 由 sigqueue 函数 产生 ， 那 么 siginfo 结构 能 
包含 应 用 特有 的 数据 (参见 10.20 节 )。 
XP: signal 月 数 
现在 用 sigaction 实现 signal 函数 。 很 多 平台 都 是 这 样 做 的 CPOSIX.I 的 基础 阐述 部 分 
也 说 明 这 是 POSIX 所 希望 的 )。 另 一 方面 ， 有 些 系 统 支持 老 的 个 可 靠 信 号 语义 signal MR, 
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其 目的 是 实现 二 进 制 向 后 兼容 。 除 非特 殊 地 要 求 老 的 不 可 靠 语 义 〈 为 了 向 后 兼容 )， 否 则 应 当 使 
用 下 面 的 signal 实现 ， 或 者 直接 调用 sigaction (可 以 在 调用 sigaction 时 指定 
SA RESETHAND 和 SA, NODEFER 选项 以 实现 老 语 义 的 signal 函数 )。 本 书 中 所 有 调用 signal 
的 实例 均 调 用 图 10-18 PSALM AK. 


ILL ILLOPC 
ILL ILLOPN 
ILL ILLADR 
ILL ILLTRP 
ILL PRVOPC 
ILL PRVREG 
ILL COPROC 
ILL BADSTK 


FPE INTDIV 
FPE INTOVF 
FPE FLTDIV 
T FPE FLTOVF 
FPE FLTUND 
FPE FLTRES 
FPE FLTINV 
FPE FLTSUB 
SIGSEGV ER MAPERR 
oe | 
不 存在 的 物理 地 址 


BUS_ADRALN 

BUS_ADRERR 
BUS_OBJERR 对 象 特定 硬件 错 
TRAP BRKPT 进程 断 点 陷入 


SIGILL 


OAM ENE 
对 于 映射 对 象 的 无 效 权限 


无 效 地 址 对 齐 


SIGCHLD 


Eo 
CLD KILLED 
CLD_DUMPED 


子 进程 已 终止 
子 进 程 已 异常 终止 (无 core? 
子 进程 已 异常 终止 《有 core) 


被 跟踪 子 进程 已 陷入 
子 进程 已 停止 
停止 的 子 进程 已 继续 


CLD_TRAPPED 
CLD_STOPPED 
CLD_CONTINUED 


#include "apue.h" 


SI_USER 
SI_QUEUE 
SI TIMER 
SI ASYNCIO 
SI MESGQ 


kill 发 送 的 信号 

sigqueue 发 送 的 入 号 

timer settime 设置 的 定时 器 超时 (实时 扩展 》 
异步 VO 请求 完成 实时 扩展 ) 

一 条 消息 到 达 消 息 队列 《实时 扩展 ) 





10-17 siginfo 七 代码 值 


/* Reliable version of signal{), using POSIX sigaction(). */ 


Sigfunc * 


signal(int signo, Sigfunc *func) 


{ 


struct sigaction act, oact; 
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act.sa handler = func; 
sigemptyset(&act.sa mask); 
act.sa flags = 0; 
if (signo == SIGALRM) | 
#ifdef SA_INTERRUPT 
act.sa flags |= SA INTERRUPT; 
#fendif 
} else { 
act.sa_flags |= SA_RESTART; 
} 
if (sigaction(signo, &act, &oact) < 0) 
return (SIG_ERR); 
return (oact.sa_handler); 


10-18 用 sigaction 实现 的 signal AX 

注意 , 必须 用 sigemptyset 函数 初始 化 act 结构 的 sa. mask 成 员 。 不 能 保证 act .sa mask-0 
会 做 同样 的 事情 。 

对 除 SIGALRM 以 外 的 所 有 信号 ， 我 们 都 有 意 尝试 设置 SA_RESTART 标志 ， 于 是 被 这 些 信号 
中 断 的 系统 调用 都 能 自动 重启 动 。 不 希望 重启 动 由 SIGALRM 信号 中 断 的 系统 调用 的 原因 是 : 我 
们 希望 对 LO 操作 可 以 设置 时 间 限 制 (请 回忆 有 关 图 10-10 的 讨论 )。 

某 些 早期 系统 (如 SunOS) 定义 了 SA INTERRUPT 标志 。 这 些 系统 的 默认 方式 是 重新 启动 
被 中 断 的 系统 调用 ， 而 指定 此 标志 则 使 系统 调用 被 中 断后 不 再 重启 动 。Linux 定义 SA INTERRUPT 
标志 ， 以 便 与 使 用 该 标志 的 应 用 程序 兼容 。 但 是 ， 如 若 信和 号 处 理 程序 是 用 sigaction 设置 的 ， 
那么 其 默认 方式 是 不 重新 启动 系统 调用 。Single UNIX Specification 的 XSI 扩展 规定 ， 除 非 说 明了 
SA RESTART 标志 ， 否 则 sigaction 函数 不 再 重启 动 被 中 断 的 系统 调用 。 = 


实例: signal intr BRK 
图 10-19 给 出 的 是 signal 函数 的 男 一 种 版 本 ， 它 力图 阻止 被 中 断 的 系统 调用 重启 动 。 


#include "apue.n" 


Sigfunc * 
signal intr(int signo, Sigfunc *func) 
{ 

struct sigaction act, oact; 


act.sa_handler = func; 
sigemptyset(&act.sa mask); 
act.sa flags - 0; 
#ifdef | SA INTERRUPT 
ct.sa flags |= SA INTERRUPT; 
#endif 
if (sigaction(signo, &act, &oact) < 0) 
return (SIG_ERR); 
return (oact.sa_handler); 


图 10-19 signal intr 函数 
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如 果 系 统 定义 了 SA INTERRUPT 标志 ， 那 么 为 了 提高 可 移植 性 ， 我 们 在 sa_flags 中 增加 
该 标志 ， 这 样 也 就 阻止 了 被 中 断 的 系统 调用 的 重启 动 。 a 


10.15 PAR sigset jmp 和 siglongjmp 


7.10 节 说 明了 用 于 非 局 部 转移 的 setjmp 和 longjmp 函数 。 在 信号 处 理 程序 中 经 常 调用 
longjmp 函数 以 返回 到 程序 的 主 循环 中 ， 而 不 是 从 该 处 理 程 序 返回 。 图 10-8 和 图 10-11 中 已 经 出 
现 了 这 种 情况 。 

但 是 ， 调 用 longjmp 有 一 个 问题 。 当 捕捉 到 一 个 信号 时 ， 进 入 信和 号 捕捉 函数 ， 此 时 当前 信和 号 
被 自动 地 加 到 进程 的 信和 号 屏蔽 字 中 。 这 阻止 了 后 来 产生 的 这 种 信号 中 断 该 信号 处 理 程 序 。 如 果 用 
longjmp 跳出 信号 处 理 程 序 ， 那 么 ， 对 此 进程 的 信号 屏蔽 字 会 发 生 什 么 呢 ? 

| 在 FreeBSD 8.0 fe Mac OS X 10.6.8 'P, setjmp 和 longjmp 保存 和 恢复 信号 屏蔽 字 。 但 是 ， 
| Linux 3.2.0 和 Solaris 10 并 不 执行 这 种 操作 ， 虽 然 Linux 支持 提供 BSD 行为 的 选项 。FreeBSD 8.0 
和 Mac OS X 10.6.8 提供 函数 _setjmp 和 _longjmp， 它 们 也 不 保存 和 恢复 信号 屏蔽 字 。 


为 了 允许 两 种 形式 并 存 ，POSIX.1 并 没有 指定 setjmp 和 Longjmp 对 信和 号 屏蔽 字 的 作用 ， 
而 是 定义 了 两 个 新 函数 sigsetjmp 和 siglongjmp. 在 信号 处 理 程序 中 进行 非 局 部 转移 时 应 当 
使 用 这 两 个 函数 。 
#include <setjmp.h> 


int sigsetjmp(sigjmp buf env, int savemask); 


返回 值 ， 若 直接 调用 ， 返 回 0; 若 从 siglongjmp 调用 返回 ， 则 返回 非 0 
void siglongjmp(sigjmp buf eny, int val); 
这 两 个 函数 和 setjmp. longjmp 之 间 的 唯一 区 别 是 sigsetjmp 增加 了 一 个 参数 。 如 果 
savemask AF 0, JJ sigsetjmp Æ env 中 保存 进程 的 当前 信和 号 屏蔽 字 。 调 用 siglongjmp 时 ， 如 果 带 
dE 0 savemask 的 sigset jmp 调用 已 经 保存 了 env. Jl siglongjmp 从 其 中 恢复 保存 的 信号 屏蔽 字 。 





当 实例 

图 10-20 中 的 程序 演示 了 在 信和 号 处 理 程序 被 调用 时 ， 系 统 所 设置 的 信和 号 屏蔽 字 如 何 自 动 地 包 
括 刚 被 捕捉 到 的 信号 。 此 程序 也 示例 说 明了 如 何 使 用 sigsetjmp 和 siglongjmp A. 
finclude "apue.h" 


#include «setjmp.h» 
#include <time.h> 


static void sig usrl(int); 
static void sig alrm(int); 
Static sigjmp buf jmpbuf; 


static volatile sig atomic t canjump; 


int 
main (void) 
{ 
if (signal (SIGUSR1, sig usrl) == SIG ERR) 
err sys("signal(SIGUSR1) error"); 
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if (signal(SIGALRM, sig alrm) -- SIG ERR) 
err_sys ("signal (SIGALRM) error"); 


pr mask ("starting main: "); /* Figure 10,14 */ 
if (sigsetjmp(jmpbuf, 1)) { 
pr_mask("ending main: "); 
exit (0); 
} 
canjump = 1; /* now sigsetjmp() is OK */ 
for ( & t) 


pause (); 
} 


static void 


sig usrl(int signo) 
( 
time t starttime; 


if (canjump == 0) 


return; /* unexpected signal, ignore */ 
pr_mask("starting sig_usrl: "); 
alarm(3); /* SIGALRM in 3 seconds */ 
starttime = time(NULL); 
for (; 7) /* busy wait for 5 seconds */ 
if (time(NULL) > starttime + 5) 
break; 


pr mask("finishing sig usrl: "); 


canjump - 0; 
siglongjmp(jmpbuf, 1);/* jump back to main, don't return */ 
} 


static void 
sig_alrm(int signo) 
{ 
pr_mask("in sig_alrm: "); 


} 
图 10-20 ABRE., sigsetjmp 和 siglongjmp 实例 

此 程序 演示 了 另 一 种 技术 ， 只 要 在 信号 处 理 程序 中 调用 siglongjmp 就 应 使 用 这 种 技术 。 
仅 在 调用 sigsetjmp 之 后 才 将 变量 canjump 设置 为 非 0 值 。 在 信号 处 理 程序 中 检测 此 变量 ， 
仅 当 它 为 非 0 值 时 才 调 用 siglongjmp。 这 提供 了 一 种 保护 机 制 ， 使 得 在 jmpbuf〔 跳 转 缓冲 ) 
尚未 由 sigsetjmp 初始 化 时 ， 防 止 调用 信号 处 理 程 序 。( 在 本 程序 中 ，siglongjmp 之 后 程序 
很 快 就 结束 ， 但 是 在 较 大 的 程序 中 ， 在 siglongjmp 之 后 的 较 长 一 段 时 间 内 ， 信 号 处 理 程序 可 
能 仍旧 被 设置 )。 在 一 般 的 C 代码 中 不 是 信号 处 理 程序 )， 对 于 longimp 并 不 需要 这 种 保护 措 
施 。 但 是 ， 因 为 信号 可 能 在 任何 时 候 发 生 ， 所 以 在 信号 处 理 程序 中 ， 需 要 这 种 保护 措施 。 
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在 程序 中 使 用 了 数据 类 型 sig atomic t, 这 是 由 ISOC 标准 定义 的 变量 类 型 ,在 写 这 种 类 
型 变量 时 不 会 被 和 中断。 这 意味 着 在 具有 虚拟 存储 器 的 系统 上 ， 这 种 变量 不 会 跨越 页 边界 ， 可 以 用 
一 条 机 器 指令 对 其 进行 访问 。 这 种 类 型 的 变量 总 是 包括 ISO 类 型 修饰 符 volatile, 其 原因 是 : 该 
变量 将 由 两 个 不 同 的 控制 线程 -~ main 函数 和 异步 执行 的 信号 处 理 程序 访问 。 图 10-21 显示 了 此 
程序 的 执行 时 间 顺 序 。 可 将 图 10-21 分 成 三 部 分 : 左面 部 分 (对 应 于 main), 中 间 部 分 (sig usr1) 
和 右面 部 分 (sig_alrm)。 在 进程 执行 左面 部 分 时 ， 信 号 屏 项 字 是 0 (没有 信和 号 是 阻塞 的 )。 而 执 
行 中 间 部 分 时 ， 其 信号 屏蔽 字 是 SIGUSR1。 执 行 右 面部 分 时 ， 信 和 号 屏蔽 字 是 STGUSR1 | SIGALRM. = 


main 
signal() 
signal() 
r mask() 
sigsetjmp() 
pause() 
-ee [sie uerl | 
pr mask() 
alarm(j 
time() 
time () 
time() 
aream es 
pr mask() 
$A $$ ——————————————— t 
ee LL 
pr mask() 
sigsetjmp() sigiongjmp() 





pr, mask( ) 
exit() 


图 10-21 处理 两 个 信和 号 的 实例 程序 的 时 间 顺 序 
执行 图 10-20 程序 ， 得 到 下 面 的 输出 : 


$ ./a.out & 在 后 台 启 动 进 程 

starting main: 

[1] 531 作业 控制 shell 打印 其 进程 ID 
$ kill -USR1 531 向 该 进程 发 送 SIGUSR1 


starting sig usrl: SIGUSR1 

$ in sig alrm: SIGUSR1 SIGALRM 

finishing sig usrl: SIGUSR1 

ending main: 

键入 回 车 

[1] + Done ./a.out & 
该 输出 与 我 们 所 期 望 的 相同 ， 当 调用 一 个 信号 处 理 程序 时 ， 被 捕捉 到 的 信号 加 到 进程 的 当前 信号 
屏 责 字 中 。 当 从 信号 处 理 程序 返回 时 ， 恢 复原 来 的 屏蔽 字 。 另 外 ，siglongjmp 恢复 了 由 
sigsetjmp 所 保存 的 信号 屏蔽 字 。 

如 果 在 Linux 中 将 图 10-20 程序 中 的 sigsetjmp 和 siglongjmp 分 别 替换 成 setjmp 和 
longjmp 《在 FreeBSD 中 ， 则 替换 成 _setjmp 和 _longjmp)， 则 最 后 一 行 输出 变 成 ; 


ending main: SIGUSRI 


这 意味 着 在 调用 setjmp 之 后 执行 main 函数 时 ， 其 SIGUSR1 是 阻塞 的 。 这 多 半 不 是 我 们 所 
希望 的 。 a 
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上 面 已 经 说 明 ， 更 改进 程 的 信和 号 屏蔽 字 可 以 阻塞 所 选择 的 信和 号， 或 解除 对 它们 的 阻塞 。 使 用 这 种 
技术 可 以 保护 不 希望 由 信号 中 断 的 代码 临界 区 。 如 果 希 望 对 一 个 信和 号 解除 阻塞 ， 然 后 pause 以 等 待 
以 前 被 阻塞 的 信号 发 生 ， 则 又 将 如 何 呢 ? 假定 信号 是 SIGINT， 实 现 这 一 点 的 一 种 不 正确 的 方法 是 ， 


sigset t newmask, oldmask; 

sigemptyset {&newmask) ; 

sigaddset (&newmask, SIGINT); 

/* block SIGINT and save current signal mask */ 

if (sigprocmask(SIG BLOCK, &newmask, &oldmask) < 0) 
err sys("SIG BLOCK error"); 

/* critical region of code */ 

/* restore signal mask, which unblocks SIGINT */ 

if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err, Sys("SIG SETMASK error"); 

/* window is open */ 

pause(); /* wait for signal to occur */ 

/* continue processing */ 


如 果 在 信号 阻塞 时 ， 产 生 了 信和 导 ， 那 么 该 信号 的 传递 就 被 推迟 直到 对 它 解除 了 阻塞 。 对 应 用 
程序 而 言 ， 该 信号 好 像 发 生 在 解除 对 SIGINT 的 阻塞 和 pause 之 间 〔 取 决 于 内 核 如 何 实现 信号 )。 
如 果 发 生 了 这 种 情况 ， 或 者 如 果 在 解除 阻塞 时 刻 和 pause 之 间 确 实 发 生 了 信号 ， 那 么 就 会 产生 
问题 。 因 为 可 能 不 会 再 见 到 该 信号 ， 所 以 从 这 种 意义 上 讲 ， 在 此 时 间 窗 口中 发 生 的 信号 丢失 了 ， 
这 样 就 使 得 pause 永远 阻塞 。 这 是 早期 的 不 可 靠 信 号 机 制 的 男 一 个 问题 。 

为 了 纠正 此 问题 ， 需 要 在 一 个 原子 操作 中 先 恢复 信号 屏蔽 字 ， 然 后 使 进程 休眠 。 这 种 功能 是 
由 sigsuspend 函数 所 提供 的 。 


finclude <signal.h> 


int sigsuspend(const sigset t *sigmask) ; 





返回 值 ， -1， 并 将 errno 设置 为 EINTR 
进程 的 信和 号 屏蔽 字 设置 为 由 sigmask 指向 的 值 。 在 捕捉 到 一 个 信号 或 发 生 了 一 个 会 终止 该 进 
程 的 信和 号 之 前 , 该 进程 被 挂 起 。 如果 捕 提 到 一 个 信号 而 且 从 该 信号 处 理 程序 返回 , 则 sigsuspend 
返回 ， 并 且 该 进程 的 信号 屏蔽 字 设 置 为 调用 sigsuspend 之 前 的 值 。 
注意 ， 此 函数 没有 成 功 返 回 值 。 如 果 它 返回 到 调用 者 ， 则 总 是 返回 -1， 并 将 errno 设置 为 
359] EINTR【〈 表 示 一 个 被 中 浙 的 系统 调用 )。 


图 10-22 显示 了 保护 代码 临界 区 ， 使 其 不 被 特定 信号 中 断 的 正确 方法 。 
finclude "apue.h" 
static void sig int(int); 
int 


main {void) 


{ 
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sigset t newmask, oldmask, waitmask; 
pr mask("program start: "); 


if (signal(SIGINT, sig int) == SIG ERR) 
err sys("signal(SIGINT) error"); 

sigemptyset(&waitmask); 

sigaddset(&waitmask, SIGUSRI); 

sigemptysetí(&newmask); 

sigaddset (&newmask, SIGINT); 


/* 
* Block SIGINT and save current signal mask. 
tf 
if (sigprocmask(SIG BLOCK, &newmask, &oldmask) < 0) 
err_sys ("SIG BLOCK error"); 


/* 
* Critical region of code. 
*/ 
pr_mask ("in critical region: "); 


/* 

* Pause, allowing all signals except SIGUSRI. 
* p 
if (sigsuspend(&waitmask) !- -1i) 


err sys("sigsuspend error"); 
pr mask("after return from sigsuspend: "); 


/* 
* Reset signal mask which unblocks SIGINT. 
去 天 
if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err Sys("SIG SETMASK error"); 


/* 
* And continue processing ... 
"f 


pr mask("program exit: "); 


exit(0); 


static void 
sig int(int signo) 


pr mask("Mnin sig int: "); 


10-22 ”保护 临界 区 不 被 信号 中 断 


注意 ， 当 sigsuspend 返回 时 ， 它 将 信号 屏蔽 字 设 置 为 调用 它 之 前 的 值 。 在 本 例 中 ，SIGINT 
信和 号 将 被 阻塞 。 因 此 将 信号 屏蔽 恢复 为 之 前 保存 的 值 (oldmask)。 


运行 图 10-22 中 的 程序 得 到 下 面 的 输出 : 
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$ ./a.out 
program start: 
in critical region: SIGINT 


se 键入 中 断 字符 
in sig int: SIGINT SIGUSR1 

after return from sigsuspend: SIGINT 
program exit: 


在 调用 sigsuspend Hf, 将 SIGUSRI 信和 号 加 到 了 进程 信号 屏蔽 字 中 ， 所 以 当 运 行 该 信号 处 理 程 
序 时 ， 我 们 得 知 信和 号 屏蔽 字 已 经 改变 了 。 从 中 可 见 ， 在 sigsuspend KAN, ERAS RRS 
恢复 为 调用 它 之 前 的 值 。 "i 


加 实例 
sigsuspend 的 另 一 种 应 用 是 等 待 一 个 信号 处 理 程序 设置 一 个 全 局 变量 。 图 10-23 中 的 程序 
用 于 捕捉 中 断 信 号 和 退出 信号 ， 但 是 希望 仅 当 捕 提 到 退出 信号 时 ， 才 唤醒 主 例 程 。 


#include “apue.h" 
volatile sig_atomic_t quitflag; /* set nonzero by signal handler */ 


static void 
Sig int(int signo) /* one signal handler for SIGINT and SIGQUIT */ 
{ 
if (signo == SIGINT) 
printf ("\ninterrupt\n"); 
else if (signo == SIGQUIT) 
quitflag = 1; /* set flag for main loop */ 


int 
main (void) 
{ 
sigset_t newmask, oldmask, zeromask; 


if (signal(SIGINT, sig_int) == SIG_ERR) 
err, Sys("signal(SIGINT) error"); 
if (signal(SIGQUIT, sig int) == SIG ERR) 


err Sys("signal(SIGQUIT) error"); 


sigemptyset (&zeromask) ; 
sigemptyset (&newmask) ; 
sigaddset (&newmask, SIGQUIT); 


/* 
* Block SIGQUIT and save current signal mask. 
wy 
if (sigprocmask(SIG BLOCK, &newmask, &oldmask) < 0) 
err Sys("SIG BLOCK error"); 


while (quitflag == 0) 
sigsuspend (&zeromask) ; 


/* 
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* SIGQUIT has been caught and is now blocked; do whatever. 
*/ 
quitflag = 0; 


A 
* Reset signal mask which unblocks SIGQUIT. 
*/ 
if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err sys("SIG SETMASK error"); 


exit(0); 
} 
10-23 Hj sigsuspend 等 待 一 个 全 局 变量 被 设置 
此 程序 的 样本 输出 是 : 
$ .fa.out 
^C 键入 中 断 字 符 
interrupt 
^C 再 次 键入 中 断 字符 
interrupt 
^C 再 一 次 
interrupt 
^ 8 用 退出 符 终止 


Xj 


考虑 到 支持 ISO C 的 非 POSIX 系统 与 POSIX 系统 两 者 之 间 的 可 移植 性 ， 在 一 个 信号 处 理 程 
” 序 中 唯一 应 当做 的 是 为 sig atomic t 类 型 的 变量 赋 一 个 值 。 POSIX.1 规定 得 更 多 一 些 ， 它 详细 
| 说 明了 在 一 个 惜 号 处 理 程序 中 可 以 安全 地 调用 的 函数 列表 ( 见 图 10-4 ), 但 是 如 果 这 样 来 编写 代码 ， 
| 则 它们 可 能 不 会 正确 地 在 非 POSIX 系统 上 运行 。 


可 以 用 信号 实现 父 、 子 进程 之 闻 的 同步 ， 这 是 信号 应 用 的 另 一 个 实例 。 图 10-24 给 出 了 8.9 
节 中 提 到 的 5 个 例 程 的 实现 , 它们 是 TELLWAIT. TELL PARENT. TELL CHILD. WAIT PARENT 
和 WAIT_CHILD。 


*include "apue.h" 


static volatile sig atomic t sigflag; /* set nonzero by sig handler */ 
static sigset t newmask, oldmask, zeromask; 


static void 
sig usr(int signo) /* one signal handler for SIGUSR1 and SIGUSR2 */ 
{ 
sigflag = 1; 
} 


void 
TELL_WAIT (void) 
{ 
if (Signal(SIGUSR1, sig usr) == SIG ERR) 
err Sys("signal(SIGUSR1) error"); 
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if (signal(SIGUSR2, sig usr) == SIG ERR) 
err Sys("signal(SIGUSR2) error"); 

sigemptyset (&zeromask) ; 

sigemptyset (&newmask) ; 

sigaddset(&newmask, SIGUSR1); 

sigaddset (&newmask, SIGUSR2); 


/* Block SIGUSR1 and SIGUSR2, and save current signal mask */ 
if (sigprocmask(SIG BLOCK, &newmask, &oldmask) « 0) 
err Sys("SIG BLOCK error"); 


void 
TELL PARENT (pid t pid) 
{ 
kill(pid, SIGUSR2); /* tell parent we're done */ 


void 
WAIT PARENT (void) 
{ 
while (sigflag == 0) 
Sigsuspend (&zeromask); /* and wait for parent */ 
sigflag = 0; 


/* Reset signal mask to original value */ 
if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err Sys("SIG SETMASK error"); 


void 
TELL CHILD(pid t pid) 


{ 
kill (pid, SIGUSR1); /* tell child we're done */ 


void 
WAIT_CHILD (void) 


{ 
while (sigflag == 0) 
sigsuspend(&zeromask); /* and wait for child */ 
sigflag = 0; 


/* Reset signal mask to original value */ 
if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err sys("SIG SETMASK error"); 


10-24 ”父子 进程 可 用 来 实现 同步 的 例 程 
其 中 使 用 TET RE E: SIGUSR1 由 父 进 程 发 送 给 子 进程 ，SIGUSR2 由 子 进程 发 
送 给 父 进 程 。 图 15-7 显示 了 使 用 管道 的 这 5 个 函数 的 男 一 种 实现 。 "i 


如 果 在 等 待 信号 发 生 时 希望 去 休眠 ， 则 使 用 sigsuspend 函数 是 非常 适当 的 《正如 在 前 面 
两 个 例子 中 所 示 )， 但 是 如 果 在 等 待 信号 期 间 希 望 调用 其 他 系统 函数 ， 那 么 将 会 怎样 呢 ? BBA 
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是 ， 在 单线 程 环境 下 对 此 问题 没有 妥善 的 解决 方法 。 如 果 可 以 使 用 多 线程 ， 则 可 专门 安排 一 个 线 
程 处 理 信号 〈 见 12.8 节 中 的 讨论 )。 

如 果 不 使 用 线程 ， 那 么 我 们 能 尽力 做 到 最 好 的 是 ， 当 信号 发 生 时 ， 在 信号 捕 提 程序 中 对 一 个 
全 局 变量 置 1。 例 如 ， 若 我 们 捕捉 SIGINT 和 SIGALRM 这 两 种 信号 ， 并 用 signal intr 函数 
设置 这 两 个 信号 的 处 理 程序 , 使 得 它们 中 断 任 一 被 阻塞 的 慢 速 系统 调用 。 当 进程 阻塞 在 调用 read 
函数 等 待 慢 速 设备 输入 时 ， 很 可 能 发 生 这 两 种 信号 (如 果 设 置 闹钟 以 阻止 永远 等 待 输 入 ， 那 么 对 
于 sIGALRM 信号 ， 这 种 情况 尤其 会 发 生 )。 处 理 这 种 问题 的 代码 类 似 于 下 面 所 示 ， 


if (intr flag) /* flag set by our SIGINT handler */ 
handle intr(): 
if (alrm flag) /* flag set by our SIGALRM handler */ 


handle alrm(); 
/* signals occurring in here are lost */ 
while (read( ... ) « 0) { 
if (errno == EINTR) { 
if (alrm_flag) 
handle_alrm(); 
else if (intr_flag) 
handle intr(): 
) else { 
/* some other error */ 


} 


) else if (n == 0} { 
/* end of file */ 
) else ( 
/* process input */ 


在 调用 read 之 前 测试 各 全 局 标志 ， 如 果 read 返回 一 个 中 断 的 系统 调用 错误 ， 则 再 次 进行 
测试 。 如 果 在 前 两 个 if 语句 和 后 随 的 read 调用 之 间 捕 捉 到 两 个 信号 中 的 任意 一 个 ， 则 问题 就 
发 生 了 。 正 如 代码 中 的 注释 所 指出 的 ， 在 此 处 发 生 的 信号 丢失 了 。 调 用 信号 处 理 程 序 ， 它 们 设置 
了 相应 的 全 局 变量 ， 但 是 read 决 不 会 返回 (除非 某 些 数据 已 准备 好 可 读 )。 

我 们 希望 实现 下 列 操作 步骤 。 

(1) 阻塞 SIGINT 和 SIGALRM. 

(2) 测试 两 个 全 局 变量 以 判别 是 否 发 生 了 一 个 信号 ， 如 果 已 发 生 则 对 此 进行 处 理 。 

(3) 调用 read (或 任何 其 他 系统 函数 ) 并 解除 对 这 两 个 信和 号 的 阻塞 ， 这 两 个 操作 应 当 是 一 
个 原子 操作 。 

仅 当 第 (3) HH pause 操作 时 ，sigsuspend 函数 才能 帮助 我 们 。 


10.17 函数 abort 
前 面 已 提 及 abort 函数 的 功能 是 使 程序 异常 终止 。 


#include <stdlib.h> 
void abort (void); 


此 消 数 不 返回 值 
此 函数 将 SIGABRT 信号 发 送 给 调用 进程 (进程 不 应 忽略 此 信号 )。ISO C 规定 ,调用 abort 
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将 向 主机 环境 递送 一 个 未 成 功 终止 的 通知 ， 其 方法 是 调用 raise (SIGABRT) MK. 


ISO 


C 要 求 若 捕 提 到 此 信号 而 且 相 应 信号 处 理 程序 返回 ，abort 仍 不 会 返回 到 其 调用 者 。 如 


果 捕 捉 到 此 信和 号， 则 信号 处 理 程序 不 能 返回 的 唯一 方法 是 它 调 用 exit. exit. Exit, longjmp 
或 siglongjmp (10.15 节 讨 论 了 longjmp 和 siglongjmp 之 间 的 区 别 )。POSIX.! 也 说 明 abort 
并 不 理会 进程 对 此 信号 的 阻塞 和 忽略。 

让 进程 捕捉 SIGABRT 的 意图 是 : 在 进程 终止 之 前 由 其 执行 所 需 的 清理 操作 。 如 果 进 程 并 不 
在 信号 处 理 程序 中 终止 自己 ，POSIX.1 声明 当 信 号 处 理 程序 返回 时 ，abort 终止 该 进程 。 


ISO 


C 针对 此 函数 的 规范 将 下 列 问题 留 由 实现 决定 : 是 否 要 冲洗 输出 流 以 及 是 否 要 删除 临时 


文件 (35.13 节 )。 POSIX.1 的 要 求 则 更 进一步 ， 它 要 求 如 果 abort 调用 终止 进程 ， 则 它 对 所 
有 打开 标准 IO 流 的 效果 应 当 与 进程 终止 前 对 每 个 流 调用 fclose 相同 。 


System V 的 早期 版 本 中 ，abort 函数 产生 SIGIOT 信号 。 更 进一步 ， 进 程 忽 略 此 信号 或 者 捕 


提 它 并 从 信号 处 理 程序 返回 ， 这 都 是 可 能 的 ， 在 返回 情况 下 ，abort 返回 到 它 的 调用 者 。 


43BSD 产生 SIGILL 信号 ,在 此 之 前 ,该 函数 解除 对 此 信号 的 阻塞 ,将 其 配置 恢复 为 SIG_DFL 
(终于 并 创建 core XH), 这 阻止 一 个 进程 忽略 或 捕 提 此 信号。 
历史 上 ，abort 的 各 种 实现 在 如 何 处理 标 准 VO 流 方面 是 并 不 相同 的 。 对 于 保护 性 的 程序 设 


: 计 以 及 为 提高 可 移植 性 ， 如 果 希 望 冲洗 标准 VO 流 ， 则 在 调用 abort 之 前 要 执行 这 种 操作 。 在 
; err dump 胃 数 中 实现 了 这 一 点 ( 见 附 录 B )。 


因为 大 多 数 UNIX 系统 tmpfile (临时 文件 ) 的 实现 在 创建 该 文件 之 后 立即 调用 unlink, 
所 以 ISOC 关于 临时 文件 的 警告 通常 与 我 们 无 关 。 


10-25 中 的 abort 函数 是 按 POSIX.1 说 明 实 现 的 。 


#include 
#include 
#include 
#include 


void 


<signal.h> 
<stdio.h> 

<stdlib.h> 
<unistd.h> 


abort (void) /* POSIX-style abort() function */ 


{ 


sigset_t mask; 
struct sigaction action; 


/* Caller can't ignore SIGABRT, if so reset to default */ 
sigaction(SIGABRT, NULL, &action); 
if (action.sa handler == SIG IGN) { 


! 


action.sa handler = SIG DFI; 
sigaction(SIGABRT, &action, NULL); 


if (action.sa handler -- SIG, DFL) 


fflush(NULL); /* flush all open stdio streams */ 


/* Caller can't block SIGABRT; make sure it's unblocked */ 
sigfillset(&mask); 
sigdelset(&mask, SIGABRT); /* mask has only SIGABRT turned off */ 
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sigprocmask (SIG_SETMASK, &mask, NULL); 
kill(getpid(), SIGABRT); /* send the signal */ 


/* If we're here, process caught SIGABRT and returned */ 


fflush(NULL): /* flush all open stdio streams */ 
action.sa handler = SIG_DFL; 

sigaction(SIGABRT, &action, NULL); /* reset to default */ 
sigprocmask (SIG_SETMASK, &mask, NULL); /* just in case ... */ 
kill (getpid(), SIGABRT); /* and one more time */ 
exit(1); /* this should never be executed ... */ 


10-25 abort 的 POSIX.1 实现 


首先 查看 是 否 将 执行 默认 动作 ， 若 是 则 冲洗 所 有 标准 VO 流 。 这 并 不 等 价 于 对 所 有 打开 的 流 
调用 fclose〔 因 为 只 冲洗 ， 并 不 关闭 它们 )， 但 是 当 进 程 终 止 时 ， 系 统 会 关闭 所 有 打开 的 文件 。 
如 果 进 程 捕捉 此 信号 并 返回 ， 那 么 因为 进程 可 能 产生 了 更 多 的 输出 ， 所 以 再 一 次 神 洗 所 有 的 流 。 
不 进行 冲洗 处 理 的 唯一 条 件 是 如 果 进 程 捕 提 此 信号 ， 然 后 调用 _exit EX 了 Exit。 在 这 种 情况 下 ， 
任何 未 冲洗 的 内 存 中 的 标准 VO 缓存 都 被 丢弃 。 我 们 假定 捕捉 此 信号 ,而且 _exit 或 Exit 的 调 
用 者 并 不 想 要 冲洗 缓冲 区 。 

回忆 10.9 节 , 如 果 调 用 kill 使 其 为 调用 者 产生 信和 号, 并 且 如 果 该 信号 是 不 被 阻塞 的 (图 10-25 
中 的 程序 保证 做 到 这 一 点 )， 则 在 kil] 返回 前 该 信号 〈 或 某 个 未 决 、 未 阻塞 的 信号 ) 就 被 传送 给 
了 该 进程 。 我 们 阻塞 除 SIGABRT 外 的 所 有 信号 ， 这 样 就 可 知 如 果 对 kill 的 调用 返回 了 ， 则 该 
进程 一 定 已 捕捉 到 该 信号 ， 并 且 也 从 该 信号 处 理 程 序 返回 。 = 
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8.13 节 已 经 有 了 一 个 system 函数 的 实现 ， 但 是 该 版 本 并 不 执行 任何 信号 处 理 。POSIX.1 要 
XX system 忽略 SIGINT 和 SIGQUIT， 阻 塞 SIGCHLD。 在 给 出 一 个 正确 地 处 理 这 些 信号 的 一 个 
版 本 之 前 ， 先 说 明 为 什么 要 考虑 信号 处 理 。 


图 10-26 中 的 程序 使 用 8.13 节 中 的 system 版 本 ， 用 其 调用 ed(1) 编 辑 器 。(ed 编辑 器 很 久 
以 来 就 是 UNIX 的 组 成 部 分 。 在 这 里 使 用 它 的 原因 是 ， 它 是 捕捉 中 断 和 退出 信号 的 交互 式 程序 。 
若 从 shell 调用 ed， 并 键入 中 断 字符 ， 则 它 捕捉 中 断 信 号 并 打印 问号 。ed 程序 对 退出 信号 的 处 理 
方式 设置 为 忽略 。) 

10-26 中 的 程序 用 于 捕捉 SIGINT 和 SIGCHLD 信号 。 若 调用 它 则 可 得 : 


S ./a.out 


a 将 正文 追加 至 编辑 器 缓冲 区 

Here is one line of text 

; 行 首 的 点 停止 追加 方式 

1,$p 打印 缓冲 区 中 的 第 一 行 至 最 后 一 行 ， 以 便 观 察 其 内 容 
Here is one line of text 

w temp.foo 将 缓冲 区 写 至 一 文件 

25 编辑 器 称 写 了 25 个 字 节 


q 离开 编辑 器 
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caught SIGCHLD 


当 编 辑 器 终止 时 ， 系 统 向 父 进程 (a .out HEE) RIK SIGCHLD 信号 。 父 进程 捕捉 它 ， 执 行 其 处 
理 程 序 sig_chid， 然 后 从 信号 处 理 程 序 返 回 。 但 是 若 父 进程 正 捕捉 SIGCHLD 信号 《因为 它 创 
建 了 子 进程 ， 所 以 应 当 这 样 做 以 便 了 解 它 的 子 进程 在 何 时 终止 )， 那 么 正在 执行 system MAN, 
应 当 阻 塞 对 父 进 程 递 送 SIGCHLD 信号。 实际 上 ， 这 就 是 POSIX.1 所 说 明 的 。 否 则 ， 当 system Gill 
建 的 子 进程 结束 时 ，system 的 调用 者 可 能 错误 地 认为 ， 它 自己 的 一 个 子 进程 结束 了 。 于 是 ， 调 
用 者 将 会 调用 一 种 wait 函数 以 获得 子 进程 的 终止 状态 ， 这 样 就 阻止 了 system 函数 获得 子 进 程 


的 终止 状态 ， 并 将 其 作为 它 的 返回 值 。 


#include "apue.h" 


static void 
sig int(int signo) 
( 


printf("caught SIGINT\n"); 


} 


static void 
sig chld(int signo) 
{ 


printf ("caught SIGCHLD\n"); 


} 


int 
main (void) 
{ 


if (signal(SIGINT, sig int) == SIG ERR) 
err sys("signal(SIGINT) error"); 
if (signal(SIGCHLD, sig chld) -- SIG ERR) 


err sys("signal(SIGCHLD) error"); 
if (system("/bin/ed") < 0) 
err sys("system() error"); 


exit(0); 


如 果 再 次 执行 该 程序 ， 在 这 次 运行 时 将 一 个 中 断 信和 号 传送 给 编辑 器 ， 则 可 得 : 


$ ./a.out 
a 
hello, world 


1,$9p 

hello, world 
w temp.foo 

13 

^c 

? 

caught SIGINT 


q 
caught SIGCHLD 


回忆 9.6 节 可 知 ， 键 入 中 断 字 符 可 使 中 断 信号 传送 给 前 台 进 程 组 中 的 所 有 进程 。 图 10-27 展示 了 编 





10-26 用 syetem 调用 ed 编辑 器 


将 正文 追加 至 编辑 器 缓冲 区 


行 首 的 点 停止 追加 方式 
打印 缓冲 区 中 的 第 一 行 至 最 后 一 行 ， 以 便 观察 其 内 容 


将 缓冲 区 写 至 一 文件 
编辑 器 称 写 了 13 个 字 节 
键入 中 断 符 
编辑 器 捕捉 信号 ， 打 印 问号 
父 进程 执行 同一 操作 

离开 编辑 器 
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辑 器 正在 运行 时 的 各 个 进程 的 关系 。 


[m EIUS 3 [ef octet ic E C KL iC ÉL Led ucc a M EC 了 了 

| l | t 

| | fork fork , fork ; | 

Ens emu ir J 本 2l 
后 台 进 程 组 前 合 进程 组 


图 10-27 图 10-26 程序 运行 时 的 前 合 和 后 人 台 进 程 组 

在 这 一 实例 中 ，SIGINT 被 送 给 3 个 前 台 进 程 (shell 进程 忽略 此 信号 )。 从 输出 中 可 见 ，a .out 
进程 和 ed 进程 捕 提 该 信号 。 但 是 ， 当 用 system 运行 另 一 个 程序 时 ， 不 应 使 父 、 子 进程 两 者 都 
捕捉 终端 产生 的 两 个 信号 :; 中 断 和 退出 。 这 两 个 信号 只 应 发 送 给 正在 运行 的 程序 ， 子 进程 。 因 为 
由 system 执行 的 命令 可 能 是 交互 式 命令 (如 本 例 中 的 ed)， 以 及 因为 system 的 调用 者 在 程序 
执行 时 放弃 了 控制 ， 等 待 该 执行 程序 的 结束 ， 所 以 system 的 调用 者 就 不 应 接收 这 两 个 终端 产生 
的 信和 号。 这 就 是 为 什么 POSIX.1 规定 system 的 调用 者 在 等 待命 令 完 成 时 应 当 忽 略 这 两 个 信号 
的 原因 。 a 


m Scl 
10-28 中 的 程序 是 system 函数 的 另 一 个 实现 ， 它 进行 了 所 要 求 的 信号 处 理 。 


#include <sys/wait.h> 
#include <errno.h> 
#include <signal.h> 
#include <unistd.h> 





int 
system(const char *cmdstring) /* with appropriate signal handling */ 
{ 

pid t pid; 

int status; 

struct sigaction ignore, saveintr, savequit; 

sigset t chldmask, savemask; 


if (cmdstring == NULL) 
return(1); /* always a command processor with UNIX */ 


ignore.sa handler - SIG IGN; /* ignore SIGINT and SIGQUIT */ 

sigemptyset(&ignore.sa mask); 

ignore.sa flags - 0; 

if (sigaction(SIGINT, &ignore, &saveintr) « 0) 
returní-1); 

if (sigaction(SIGQUIT, &ignore, &savequit) < 0) 
return(-1); 

sigemptyset (&chldmask) ; /* now block SIGCHLD */ 

sigaddset(&chldmask, SIGCHLD); 

if (sigprocmask(SIG BLOCK, &chldmask, &savemask) < 0) 
returní(-1); 


if ((pid = fork()) < 0) ( 
status = -1; /* probably out of processes */ 

) else if (pid == 0) ( /* child */ 
/* restore previous signal actions & reset signal mask */ 
sigaction(SIGINT, &saveintr, NULL); 
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sigaction(SIGQUIT, &savequit, NULL); 
sigprocmask(SIG SETMASK, &savemask, NULL); 


execl("/bin/sh", "sh", "-c", cmdstring, (char *)0); 
.exit(127); /* exec error */ 
) else { /* parent */ 
while (waitpid(pid, &status, 0) < 0) 
if (errno !- EINTR) { 
status = -1; /* error other than EINTR from waitpid() */ 
break; 


) 


/* restore previous signal actions & reset signal mask */ 
if (sigaction(SIGINT, &saveintr, NULL) < 0) 
return(-1); 
if (sigaction(SIGQUIT, &savequit, NULL) < 0) 
returní-1); 
if (sigprocmask(SIG SETMASK, &savemask, NULL) < 0) 
returní-1); 


return(status); 


10-28 system 函数 的 POSIX.1 正确 实现 
如 果 将 图 10-26 中 的 程序 与 system 函数 的 这 一 实现 相 链 接 ， 那 么 所 产生 的 二 进 制 代码 与 上 
一 个 有 缺 陷 的 程序 相 比 较 ， 存 在 如 下 差别 。 
C1) 当 我 们 键入 中 断 字符 或 退出 字符 时 ， 不 向 调用 进程 发 送信 和 号。 
(2) 当 ed 命令 终止 时 ， 不 向 调用 进程 发 送 SIGCHLD 信号 。 作 为 替代 ， 在 程序 末尾 的 
sigprocmask 调用 对 SIGCHLD 信号 解除 阻塞 之 前 ，SIGCHLD 信号 一 直 被 阻塞 。 而 对 
sigprocmask 函数 的 这 一 次 调用 是 在 system 函数 调用 waitpid 获取 子 进程 的 终止 状态 之 后 。 


: POSIX.1 说 明 ， 在 SIGCHLD 未 决 期 间 ， 如 若 wait A waitpid 返回 了 子 进 程 的 状态 ， 那 么 

”SIGCHLD 信号 不 应 递送 给 该 父 进 程 ， 除 非 另 一 个 子 进程 的 状态 也 可 用 。FreeBSD 8.0, Mac OS X 
10.6.8 和 Solaris 10 都 实现 了 这 种 语义 ,而 Linux 32.0 没有 实现 这 种 语义 ,在 system 函数 调用 了 
waitpid Æ, SIGCHLD 保持 为 未 决 ; 当 解 除了 对 此 信号 的 阻塞 后 ， 它 被 递送 至 调用 者 。 如 果 我 

' 414 HE 10-26 的 sig chld 函数 中 调用 wait, Linux 系统 将 返回 ~1， 并 将 errno 设置 为 ECHILD, 
因为 system 函数 已 取 到 子 进程 的 终止 状态 。 


很 多 较 早 的 书 中 使 用 下 列 程序 段 ， 它 忽略 中 断 和 退出 信号 : 


if ( (pid = fork()) < 0})1 
err sys("fork error"); 

)else if (pid == 0) { 
/* child */ 
execl(...): 
.exit(127); 

} 


/* parent */ 
old intr = signal (SIGINT, SIG IGN); 
old quit - signal(SIGQUIT, SIG IGN); 
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waitpid(pid, &status, 0) 

signal(SIGINT, old intr); 

signal(SIGQUIT, old quit); 

这 段 代码 的 问题 是 ， 在 fork 之 后 不 能 保证 父 进程 还 是 子 进程 先 运行 。 如 果子 进程 先 运行 ， 
父 进程 在 一 段 时 间 后 再 运行 ， 那 么 在 父 进程 将 中 断 信号 的 处 理 更 改 为 忽略 之 前 ， 就 可 能 产生 这 种 
信和 号。 由 于 这 种 了 原因， 图 10-28 中 在 fork 之 前 就 改变 对 该 信号 的 配置 。 

注意 ， 子 进程 在 调用 execl 之 前 要 先 恢复 这 两 个 信号 的 处 理 。 如 同 8.10 节 中 所 说 明 的 一 样 ， 
这 就 允许 在 调用 者 配置 的 基础 上 ，execl 可 将 它们 的 配置 更 改 为 默认 值 。 a 


system 的 返回 值 


注意 system 的 返回 值 ， 它 是 shell 的 终止 状态 , 但 shell 的 终止 状态 并 不 总 是 执行 命令 字符 串 进 
程 的 终止 状态 。 图 8-23 中 有 一 些 例子 ， 其 结果 正 是 我 们 所 期 望 的 。 如 果 执 行 一 条 如 date 那样 的 简 
单 命令 ， 其 终止 状态 是 0。 执 行 shell 命令 exit 44， 则 得 终止 状态 4。 在 信号 方面 又 如 何 呢 ? 

运行 图 8-24 程序 ， 并 向 正在 执行 的 命令 发 送 一 些 信号 : 


$ tsys "sleep 30" 


^Cnormal termination, exit status - 130 键入 中 断 符 

$ tsys "sleep 30" 

“\sh: 946 Quit 键入 退出 符 

normal termination, exit status - i31 371 


当 用 中 断 信和 号 终止 sleep 时 , pr exit 函数 ( 见 图 8-5) 认为 它 正常 终止 。 当 用 退出 符 杀 死 sleep 
进程 时 ， 会 发 生 同 样 的 事情 。 终 止 状态 130. 131 又 是 怎样 得 到 的 呢 ? 原来 Bourne shell 有 一 个 在 
其 文档 中 没有 说 清楚 的 特性 ， 其 终止 状态 是 128 加 上 一 个 信号 编号 ， 该 信号 终止 了 正在 执行 的 命 
令 。 用 交互 方式 使 用 shell 可 以 看 到 这 一 点 。 


$ sh 确保 运行 Bourne shell 

$ sh -c "sleep 30" 

^C BAP 

$ echo $? 打印 最 后 一 条 命令 的 终止 状态 
130 


$ sh -c "sleep 30" 
^Nsh: 962 Quit - core dumped ”键入 退出 符 


$ echo $? 打印 最 后 一 条 命令 的 终止 状态 
131 
$ exit 离开 Bourne shell 


在 所 使 用 的 系统 中 ，SIGINT 的 值 为 2，sIGQUIT 的 值 为 3， 于 是 给 出 shell 终止 状态 130, 131. 
再 试 一 个 类 似 的 例子 ， 这 一 次 将 一 个 信号 直接 送 给 shell， 然 后 观察 system 返回 什么 : 


$ tsys "sleep 30" 6 这 一 次 在 后 台 和 启动 它 
9257 
$ ps -f 查看 进程 ID 


UID PID PPID  TTY TIME CMD 
sar 9260 949 pts/5 0:00 ps -f 
sar 9258 9257 pts/5 0:00 sh -c sleep 30 
sar 949 947 pts/5 0:01 /bin/sh 
sar 9257 949 pts/5 0:00 tsys sleep 30 
sar 9259 9258 pts/5 0:00 sleep 30 
$ kill -KILL 9258 XE shell 自身 
abnormal termination, signal number - 9 
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从 中 可 见 ， 仅 当 shell 本 身 异 常 终止 时 ，system 的 返回 值 才 报告 一 个 异常 终止 。 


其 他 的 shell 在 处 理 终 端 产 生 的 信号 ( 如 SIGINT 和 SIGQUIT ) 时 表现 出 来 的 行为 各 不 相同 。 
“例如 在 bash 和 dash 中 ,键入 中 断 或 授 出 符 会 导致 带 有 对 应 信号 编号 的 表示 异常 终止 的 退出 状态 。 
”但 是 ， 如 果 发 现 正 在 执行 sleep 的 进程 并 直接 给 它 发 送信 号 , 这 样 信 号 只 会 到 达 单 个 进程 而 不 是 
， 整 个 前 台 进程 组 。 这 些 shell 与 Bourne shell 类 似 ， 以 正常 终止 状态 128 加 上 信号 编号 退出 。 


在 编写 使 用 system 函数 的 程序 时 ， 一 定 要 正确 地 解释 返回 值 。 如 果 直 接 调用 fork. exec 
和 wait， 则 终止 状态 与 调用 system 是 不 同 的 。 
10.19 函数 sleep, nanosleep 和 clock_nanosleep 


在 本 书 的 很 多 例子 中 都 已 使 用 了 sheep 函数 ， 在 图 10-7 程序 和 图 10-8 程序 中 有 两 个 sleep 的 
实现 ， 但 它们 都 是 有 缺陷 的 。 


#include <unistd.h> 


unsigned int sleep(unsigned int seconds); 





此 函数 使 调用 进程 被 挂 起 直到 满足 下 面 两 个 条 件 之 一 。 

(1) 已 经 过 了 seconds 所 指定 的 墙 上 时 钟 时 间 。 

(2) 调用 进程 捕 提 到 一 个 信号 并 从 信号 处 理 程序 返回 。 

wi alarm 信号 一 样 ， 由 于 其 他 系统 活动 ， 实 际 返 回 时 间 比 所 要 求 的 会 迟 一 些 。 

在 第 1 种 情形 ， 返 回 值 是 0。 当 由 于 捕捉 到 某 个 信号 sleep 提早 返回 时 (第 2 种 情形 )， 返 
回 值 是 未 休 限 完 的 秒 数 〈 所 要 求 的 时 间 减 去 实际 休 卢 时间)。 

尽管 sleep 可 以 用 alarm 函数 (A 10.10 $) 实现 , 但 这 并 不 是 必需 的 。 如 果 使 用 alarm, 
则 这 两 个 函数 之 间 可 能 相互 影响 。POSIX.1 标准 对 这 些 相 互 影 响 并 未 做 任何 说 明 。 例 如 ， 若 先 调用 
alarm(10)， 过 了 3 秒 后 又 调用 sleep($)， 那 么 将 如 何 呢 ? sleep 将 在 5 秒 后 返回 (假定 在 这 段 时 间 
内 没有 捕 提 到 另 一 个 信号 )， 但 是 否 在 2 秒 后 义 产 生 另 一 个 SIGALRM 信号 呢 ? 此 细节 与 具体 实现 有 关 。 


FreeBSD 8.0, Linux 3.2.0, Mac OS X 10.6.8 和 Solaris 10 用 nanosleep 函数 实现 sleep, 
| 使 sleep 县 体 实现 与 信号 和 辣 钟 定时 器 相互 独立 。 者 虑 到 可 移植 性 ， 不 应 对 sleep 的 实现 进行 任何 
”假定 ， 但 是 如 果 混 合 调用 sleep 和 其 他 与 时 间 有 关 的 汤 数 ， 则 需 了 解 它们 之 间 可 能 产生 的 交互 。 


ES: 

10-29 给 出 的 是 一 个 POSIX.1 sleep 函数 的 实现 。 此 函数 是 图 10-7 程序 的 修改 版 ， 它 可 
靠 地 处 理 信号 ， 避 免 了 早期 实现 中 的 竞争 条 件 ， 但 是 仍 未 处 理 与 以 前 设置 的 闹钟 的 交互 作用 《 正 
如 前 面 提 到 的 ，POSIX.1 并 未 显 式 地 对 这 些 交 互 进 行 定 义 )。 


finclude "apue.h" 


static void 
sig alrm(int signo) 
( 


/* nothing to do, just returning wakes up sigsuspend() */ 
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} 


unsigned int 373 
sleep(unsigned int seconds) 
i 

struct sigaction newact, oldact; 

sigset t newmask, oldmask, suspmask; 

unsigned int unslept; 


/* set our handler, save previous information */ 
newact.sa handler = sig alrm; 
sigemptyset(&newact.sa mask); 

newact.sa flags - 0; 

sigaction(SIGALRM, &newact, &oldact); 


/* block SIGALRM and save current signal mask */ 
sigemptyset (&newmask) ; 

sigaddset {&newmask, SIGALRM) ; 

sigprocmask(SIG BLOCK, &newmask, &oldmask); 


alarm(seconds); 
suspmask - oldmask; 


/* make sure SIGALRM isn't blocked */ 
sigdelsetí(&suspmask, SIGALRM); 


/* wait for any signal to be caught */ 
sigsuspend(&suspmask); 


/* some signal has been caught, SIGALRM is now blocked */ 
unslept - alarm(0); 


/* reset previous action */ 
sigaction(SIGALRM, &oldact, NULL); 


/* reset signal mask, which unblocks SIGALRM */ 
sigprocmask(SIG SETMASK, &oldmask, NULL); 
return (unslept) ; 


10-29 sleep 的 可 靠 实现 
与 图 10-7 相 比 ， 为 了 可 靠 地 实现 sleep, Æ 10-29 的 代码 比较 长 。 程序 中 没有 使 用 任何 形式 
的 非 局 部 转移 (如 图 10-8 中 为 了 避免 在 alarm 和 pause 之 间 的 竞争 条 件 所 做 的 那样 》， 所 以 对 
处 理 SIGALRM 信号 期 间 可 能 执行 的 其 他 信号 处 理 程 序 没有 任何 影响 。 "T 
nanosleep MAS sleep 函数 类 似 ， 但 提供 了 纳 秘 级 的 精度 。 


#include <time.h> 


int nanosleep(const struct timespec *regip, struct timespec *remip): 


返回 值 ， 若 休眠 到 要 求 的 时 间 ， 返 回 0， 若 出 错 ， 返 回 -1 





这 个 函数 挂 起 调用 进程 ,直到 要 求 的 时 间 已 经 超时 或 者 某 个 信号 中 断 了 该 函数 。reqip 参数 用 
秒 和 纳 秒 指定 了 需要 休眠 的 时 间 长 度 。 如 果 某 个 信号 中 汤 了 休眠 间隔 ， 进 程 并 没有 终止 ，remip 
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参数 指向 的 timespec 结构 就 会 被 设置 为 未 休眠 完 的 时 间 长 度 。 如 果 对 未 休眠 完 的 时 间 并 不 感 兴 
趣 ， 可 以 把 该 参数 置 为 NULL。 
如 果 系统 并 不 支持 纳 秒 这 一 精度 ， 要 求 的 时 间 就 会 取 整 。 因 为 nanosleep 函数 并 不 涉及 产 
生 任 何 信 和 号， 所 以 不 需要 担心 与 其 他 函数 的 交互 。 
nanosleep 函数 过 去 属于 Single UNIX Specification 的 定时 器 选项 ， 现 已 被 移 至 SUSv4 的 基 
EB rM 


随 着 多 个 系统 时 钟 的 引入 《回忆 6.10 节 》， 和 需要 使 用 相对 于 特定 时 钟 的 延迟 时 间 来 挂 起 调用 
线程 。clock_nanosleep 枯 数 提供 了 这 种 功能 。 


#inelude «time.h» 


int clock nanosleep(clockid t clock id, int flags, 


const struct timespec *regip, struct timespec *remtp); 
返回 值 ， 若 休眠 要 求 的 时 间 ， 返 回 0， 若 出 错 ， 返 回 错误 码 

clock 这 参数 指定 了 计算 延迟 时 间 基 于 的 时 钟 。 时 钟 标识 符 列 于 图 6-8 H. flags 参数 用 于 控制 延 
AR REDE KEERN. flags 为 0 时 表示 休眠 时 间 是 相对 的 《例如 , 希望 休眠 的 时 间 长 度 ), 如 果 flags 
值 设置 为 TIMER_ABSTIME， 表 示 休 眼 时 间 是 绝对 的 例如， 希望 休眠 到 时 钟 到 达 某 个 特定 的 时 间 )。 

其 他 的 参数 reqtp 和 remp, 45 nanosleep 哨 数 中 的 相同 。 但 是 ， 使 用 绝对 时 间 时 ，remip 参数 
未 使 用 ， 因 为 没有 必要 。 在 时 钟 到 达 指 定 的 绝对 时 间 值 以 前 ， 可 以 为 其 他 的 clock nanosleep 
调用 复 用 regtp 参数 相同 的 值 。 

注意 ， 除 了 出 错 返 回 ， 调 用 

clock nanosleep(CLOCK REALTIME, 0, reqtp, remtp); 
和 调用 

nanosleep(reqtp, remtp); 
的 效果 是 相同 的 。 使 用 相对 休眠 的 问题 是 有 些 应 用 对 休眠 长 度 有 精度 要 求 ， 相 对 休眠 时 间 会 导致 
实际 休眠 时 间 比 要 求 的 长 。 例 如 ， 某 个 应 用 程序 希望 按 固 定 的 时 间 间 隔 执行 任务 ， 就 必须 获取 当 
前 时 间 , 计算 下 次 执行 任务 的 时 间 , 然后 调用 nanosleep。 在 获取 当前 时 间 和 调用 nanosleep 
之 间 ， 处 理 器 调度 和 抢占 可 能 会 导致 相对 休眠 时 间 超 过 实际 需要 的 时 间 间 陋 。 即 便 分 时 进程 调 
度 程序 对 休眠 时 间 结 束 后 是 否 会 马上 执行 用 户 任务 并 没有 给 出 保证 ， 使 用 绝对 时 间 还 是 改善 了 
精度 。 





在 Single UNIX Specification 的 早期 版 本 中 ，ciock_nanosleep 哑 数 属于 时 钟 选择 选项 , 在 
| SUSv4 中 ， KK BK CAS ER aK, 


10.20 PAR sigqueue 


在 10.8 节 中 ， 我 们 介绍 了 大 部 分 UNIX 系统 不 对 信号 排队 。 在 POSIX.1 的 实时 扩展 中 ， 有 
些 系统 开始 增加 对 信和 号 排队 的 支持 。 在 SUSv4 中 ， 排 队 信和 号 功能 已 从 实时 扩展 部 分 移 至 基础 说 
明 部 分 。 

通常 一 个 信号 带 有 一 个 位 信息 : 信和 号 本 身 。 除 了 对 信和 号 排队 以 外 ， 这 些 扩展 允许 应 用 程序 在 
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递交 信号 时 传递 更 多 的 信息 (回忆 10.14 节 )。 这 些 信息 嵌入 在 siginfo 结构 中 。 除 了 系统 提供 
的 信息 ， 应 用 程序 还 可 以 向 信号 处 理 程序 传递 整数 或 者 指向 包含 更 多 信息 的 缓冲 区 指针 。 

使 用 排队 信号 必须 做 以 下 几 个 操作 。 

C1) 使 用 sigaction 函数 安装 信号 处 理 程序 时 指定 SA SIGINFO 标志 。 如 果 没 有 给 出 这 个 
标志 ， 信 和 号 会 延迟 ， 但 信和 号 是 否 进入 队列 要 取决 于 具体 实现 。 

(2) 在 sigaction 结构 的 sa sigaction 成 员 中 《而 不 是 通常 的 sa handler FR) 提 
供 信号 处 理 程序 。 实 现 可 能 允许 用 户 使 用 sa handler 字段 ， 但 不 能 获取 sigqueue 函数 发 送 
出 来 的 额外 信息 。 

(3) 使 用 sigqueue 函数 发 送信 号 。 





sigqueue 函数 只 能 把 信号 发 送 给 单个 进程 ， 可 以 使 用 value ppp 
和 指针 值 ， 除 此 之 外 ，sigqueue 函数 与 kill 函数 类 似 。 

信和 号 不 能 被 无 限 排队 。 回 忆 图 2-9 和 图 2-11 中 的 SIGQUEUE MAX 限制 。 到 达 相 应 的 限制 以 
后 ，sigqueue 就 会 失败 ， 将 errno KA EAGAIN. 

随 着 实时 信和 号 的 增强 ， 引 入 了 用 于 应 用 程序 的 独立 信号 集 。 这 些 信和 号 的 编号 在 STGRTMIN~ 
SIGRTMAX 之 间 ， 包 插 这 两 个 限制 值 。 注 意 ， 这 些 信号 的 默认 行为 是 终止 进程 。 

图 10-30 总 结 了 排队 信和 号 在 本 书 不 同 的 实现 中 的 行为 上 的 差异 。 


Mac OS X 10.6.8 并 不 支持 sigqueue 或 者 实时 信号 。 在 Solaris 10 中 ，sigqueue 在 实时 库 
librt 中 。 


FreeBSD Linux MacOS Solaris 


SUS 8.0 320 X1068 10 


支持 sigqueue 
对 在 SIGRTMIN 和 SIGRTMAX 之 外 的 信和 号 排队 
即使 调用 者 没 使 用 SA SIGINFO 标志 ， 也 对 信和 号 排队 


10-30 ”不同 平台 上 排队 信和 号 的 行为 
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在 图 10-1 所 示 的 信号 中 ，POSIX.1 认为 有 以 下 6 个 与 作业 控制 有 关 。 

SIGCHLD 子 进 程 已 停止 或 终止 。 

SIGCONT ”如 果 进 程 已 停止 ， 则 使 其 继续 运行 。 

SIGSTOP 停止 信号 (不 能 被 搬 捉 或 忽略 )。 

SIGTSTP 交互 式 停 止 信和 号。 

SIGTTIN 后 台 进 程 组 成 员 读 控制 终端 。 

SIGTTOU 后 台 进 程 组 成 员 写 控制 终端 。 

BE SIGCHLD 以 外 ， 大 多 数 应 用 程序 并 不 处 理 这 些 信 号 ， 交 互 式 shell 则 通常 会 处 理 这 些 信号 
的 所 有 工作 。 当 键入 挂 起 字符 (通常 是 Ctrl+Z) 时 ，SIGTSTP 被 送 至 前 台 进程 组 的 所 有 进程 。 当 
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我 们 通知 shell 在 前 台 或 后 台 恢 复 运行 一 个 作业 时 ，shell 向 该 作业 中 的 所 有 进程 发 送 STGCONT 信 
号 。 与 此 类 似 ， 如 果 向 一 个 进程 递送 了 SIGTTIN 或 SIGTTOU 信和 号 ， 则 根据 系统 默认 的 方式 ， 停 
止 此 进程 ， 作 业 控 制 shell 了 解 到 这 一 点 后 就 通知 我 们 。 

一 个 例外 是 管理 终端 的 进程 ， 例 如 ，vi(1) 编 辑 器 。 当 用 户 要 挂 起 它 时 ， 它 需要 能 了 解 到 这 一 
点 ， 这 样 就 能 将 终端 状态 恢复 到 vi 启动 时 的 情况 。 另 外 ， 当 在 前 台 恢 复 它 时 ， 它 需要 将 终端 状 
态 设置 回 它 所 希望 的 状态 ， 并 需要 重新 绘制 终端 屏幕 。 可 以 在 下 面 的 例子 中 观察 到 与 vi 类 似 的 
程序 是 如 何 处 理 这 种 情况 的 。 

在 作业 控制 信号 间 有 某 些 交互 。 当 对 一 个 进程 产生 4 种 停止 信号 (SIGTSTP. SIGSTOP, 
SIGTTIN 或 SIGTTOU) 中 的 任意 一 种 时 ， 对 该 进程 的 任 一 未 决 SIGCONT 信和 号 就 被 丢弃 。 与 此 
类 似 ， 当 对 一 个 进程 产生 SIGCONT 信和 号 时 ， 对 同一 进程 的 任 一 未 决 停止 信号 被 丢弃 。 

注意 ， 如 果 进 程 是 停止 的 ， 则 SIGCONT 的 默认 动作 是 继续 该 进程 ， 和 否则 忽略 此 信和 号。 通常 ， 
对 该 信号 无 需 做 任何 事情 。 当 对 一 个 停止 的 进程 产生 一 个 siccont 信号 时 ， 该 进程 就 继续 ， 即 
使 该 信号 是 被 阻塞 或 忽略 的 也 是 如 此 。 


aX 

图 10-31 中 的 程序 演示 了 当 一 个 程序 处 理 作业 控制 时 通常 所 使 用 的 规范 代码 序列 。 该 程序 只 
是 将 其 标准 输入 复制 到 其 标准 输出 ， 而 在 信号 处 理 程序 中 以 注释 形式 给 出 了 管理 屏幕 的 程序 所 执 
行 的 典型 操作 。 
#include "apue.h" 
#define BUFFSIZE 1024 


static void 
sig_tstp(int signo) /* signal handler for SIGTSTP */ 
{ 

sigset_t mask; 


/* ... move cursor to lower left corner, reset tty mode ... */ 
/* 
* Unblock SIGTSTP, since it's blocked while we're handling it. 
*/ 


sigemptyset (&mask); 

sigaddset(&mask, SIGTSTP); 

sigprocmask(SIG UNBLOCK, &mask, NULL); 

signal (SIGTSTP, SIG DFL); /* reset disposition to default */ 
kill(getpid(), SIGTSTP);  /* and send the signal to ourself */ 
/* we won't return from the kill until we're continued */ 


signal(SIGTSTP, sig tstp); /* reestablish signal handler */ 


/* ... reset tty mode, redraw screen ... */ 
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main (void) 
{ 


int n; 

char buf (BUFFSIZE]; 

/* 
* Only catch SIGTSTP if we're running with a job-control shell. 
*7 

if (signal(SIGTSTP, SIG IGN) == SIG, DFL) 


signal(SIGTSTP, sig tstp); 


while ((n = read(STDIN FILENO, buf, BUFFSIZE)) > 0) 
if (write(STDOUT FILENO, buf, n) != n) 
err_sys ("write error"); 


if (n < 0) 
err sys("read error"); 


exit(0); 


10-31 如何 处 理 SIGTSTP 


当 图 10-31 中 的 程序 启动 时 , M4 sictste 信号 的 配置 是 SIG_DFL, 它 才 安排 捕捉 该 信号 。 
其 理由 是 : 当 此 程序 由 不 支持 作业 控制 的 shell (如 /bin/sh) 启动 时 ， 此 信和 号 的 配置 应 当 设 置 为 
SIG_IGN。 实 际 上 ，shell 并 不 显 式 地 忽略 此 信和 号， 而 是 由 init 将 这 3 个 作业 控制 信号 SIGTSTP、 
SIGTTIN 和 SIGTTOU 设置 为 SIG_IGN。 然 后 ， 这 种 配置 由 所 有 登录 shell 继承 。 只 有 作业 控制 
shell 才 应 将 这 3 个 信号 重新 设置 为 SIG_DFL。 

当 键 入 挂 起 字符 时 ， 进 程 接 到 sictste 信号 ， 然 后 调用 该 信号 处 理 程序 。 此 时 ， 应 当 进 行 
与 终端 有 关 的 处 理 : 将 光标 移 到 左下 角 、 恢 复 终端 工作 方式 等 。 在 将 SIGTSTP 重 置 为 默认 值 ( 停 
止 该 进程 )， 并 且 解 除了 对 此 信号 的 阻塞 之 后 ， 进 程 向 自己 发 送 同一 信和 号 STGTSTP。 因 为 正在 处 
理 SIGTSTP 信和 号， 而 在 捕 提 该 信号 期 间 系 统 自动 地 阻塞 它 ， 所 以 应 当 解 除 对 此 信和 号 的 阻塞 。 到 
达 这 一 点 时 , 系统 停止 该 进程 。 仅 当 某 个 进程 (通常 是 正 响应 一 个 交互 式 fg 命令 的 作业 控制 shell) 
向 该 进程 发 送 一 个 SIGCONT 信号 时 ， 该 进程 才 继续 。 我 们 不 捕 损 SIGCONT 信号 。 该 信号 的 默 
认 配 置 是 继续 运行 停止 的 进程 ， 当 此 发 生 时 ， 此 程序 如 同 从 kill 函数 返回 一 样 继续 运行 。 当 
此 程序 继续 运行 时 , 将 SIGTSTP 信号 重 置 为 捕捉 ， 并 且 做 我 们 所 希望 做 的 终端 处 理 (如 重新 绘 
制 屏幕 )。 a 


10.22 信号 名 和 编号 


本 节 介 绍 如 何在 信号 编号 和 信号 名 之 间 进 行 映射 。 某 些 系 统 提供 数组 
extern char *sys siglist[]; 
数组 下 标 是 信号 编号 ， 数 组 中 的 元 素 是 指向 信号 名 符 串 的 指针 。 
FreeBSD 8.0, Linux 3.2.0 和 Mac OS X 10.6.8 都 提供 这 种 信号 名 数组 。Solaris 10 也 提供 信号 
| 名 数组 ， 但 该 数组 名 是 sys siglist. 


可 以 使 用 psignal 函数 可 移植 地 打印 与 信号 编号 对 应 的 字符 串 。 
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#include <signal.h> 





void psignal (int signo, const char *msg); 


字符 串 msg (通常 是 程序 名 〉 输出 到 标准 错误 文件 ， 后 面 跟随 一 个 冒号 和 一 个 空格 ， 再 后 面 
对 该 信号 的 说 明 ， 最 后 是 一 个 换行 符 。 如 果 msg? NULL， 只 有 信和 号 说 明 部 分 输出 到 标准 错误 文 
件 ， 该 函数 类 似 于 perror (1.7 节 )。 

如 果 在 sigaction 信号 处 理 程序 中 有 siginfo 结构 ， 可 以 使 用 psiginfo 函数 打印 信和 号 
信息 。 


#include <signal.h> 





void psiginfo(const siginfo t *info, const char *msg); 


它 的 工作 方式 与 psignal 函数 类 似 。 虽 然 这 个 函数 访问 除 信 和 号 编导 以 外 的 更 多 信息 ， 但 不 
同 的 平台 输出 的 这 些 额外 信息 可 能 有 所 不 同 。 

如 果 只 需要 信和 号 的 字符 描述 部 分 ， 也 不 需要 把 它 写 到 标准 错误 文件 中 《〈 如 可 以 写 到 日 志文 件 
中 )， 可 以 使 用 strsignal 函数 ， 它 类 似 于 strerror (H0 1.7 节 )。 


#include <string.h> 


char *strsignal (int signa); 





给 出 一 个 信号 编号 ，strsignal 将 返回 描述 该 信号 的 字符 串 。 应 用 程序 可 用 该 字符 串 打印 
关于 接收 到 信号 的 出 错 消 息 。 
i 本 书 讨论 的 所 有 平台 都 提供 psignal 和 strsignal 函数 ,但 相互 之 间 有 些 差别 。 在 Solaris 
，10 中 ， 若 信号 编号 无 效 ，strsignal 将 返回 一 个 空 指针 ， 而 FreeBSD 8.0, Linux 3.2.0 和 Mac OS 
| X 10.6.8 则 返回 一 个 字符 串 ， 它 指出 信号 编号 是 不 可 识别 的 。 
i 只 有 Linux 3.2.0 和 Solaris 10 支持 psiginfo 函数 。 


Solaris 提供 一 对 函数 ， 一 个 函数 将 信号 编号 映射 为 信号 名 ， 另 一 个 则 反之 。 


#include «signal.h» 


int sig2str(int signo, char *str); 


int str2sig(const char *str, int *signop); 





在 编写 交互 式 程序 ， 其 中 需 接 收 和 打印 信号 名 和 信和 号 编号 时 ， 这 两 个 函数 是 有 用 的 。 

sig2str 函数 将 给 定 信号 编号 翻译 成 字符 串 ， 并 将 结果 存放 在 str 指向 的 存储 区 。 调用 
者 必须 保证 该 存储 区 足够 大 ， 可 以 保存 最 长 字符 串 ， 包 括 终 止 null 字 节 Solaris 在 
<signal.h> 中 包含 了 常量 SIG2STR_MRX， 它 定义 了 最 大 字符 串 长 度 。 该 字符 串 包 括 不 带 
“SIG” 前 缀 的 信号 名 。 例 如 ，SIGKILL 被 翻译 为 字符 串 “KILL”， 并 存放 在 str 指向 的 存储 
缓冲 区 中 。 

str2sig 函数 将 给 出 的 信号 名 翻译 成 信号 编号 。 该 信号 编号 存放 在 signop 指向 的 整 型 中 。 
名 字 要 么 是 不 带 “SIG” 前 缀 的 信号 名 ， 要 么 是 表示 十 进 制 信号 编号 的 字符 串 〈 如 “9”)。 

注意 ，sig2str 和 str2sig 与 常用 的 函数 做 法 不 同 ， 当 它们 失败 时 ， 并 不 设置 errno。 
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10.23 小 结 


信号 用 于 大 多 数 复杂 的 应 用 程序 中 。 理 解 进行 信号 处 理 的 原因 和 方式 对 于 高 级 UNIX 编程 极 
其 重要 。 本 章 对 UNIX 信和 号 进行 了 详细 而 且 比 较 深 入 的 介绍 。 首 先 说 明了 早期 信号 实现 的 问题 以 
及 它们 是 如 何 显现 出 来 的 。 然 后 介绍 了 POSIX.1 的 可 靠 信号 概念 以 及 所 有 相关 的 函数 。 在 此 基础 
上 提供 了 abort. system 和 sleep 函数 的 POSIX.1 实现 。 最 后 以 观察 分 析 作 业 控 制 信号 以 及 
信号 名 和 信号 编号 之 间 的 转换 结束 。 


习题 


10.1 删除 图 10-2 程序 中 的 for(;;) 语句 ， 结 果 会 怎样 ? 为 什么 ? 

10.2 实现 10.22 节 中 说 明 的 sig2str MR. 

10.3 画 出 运行 图 10-9 程序 时 的 栈 帧 情况 。 

10.4 图 10-11 程序 中 利用 set jmp 和 1ongjmp 设置 IO 操作 的 超时 ， 下 面 的 代码 也 常见 用 于 此 
种 目的 : 


signal (SIGALRM, sig alrm); 

alarm(60); 

if (setjmp(env alrm) != 0) ( 
/* handle timeout */ 


} 


这 段 代 码 有 什么 错误 ? 

10.5 仅 使 用 一 个 定时 器 (alarm 或 较 高 精度 的 setitimer)， 构 造 一 组 函数 ， 使 得 进程 在 该 单 
一 定时 器 基础 上 可 以 设置 任 一 数量 的 定时 器 。 

10.6 编写 一 段 程序 测试 图 10-24 中 父 进程 和 子 进程 的 同步 函数 ， 要 求 进程 创建 一 个 文件 并 向 
文件 写 一 个 整数 0， 然 后 ， 进 程 调 用 fork， 接 着 ， 父 进程 和 子 进程 交替 增加 文件 中 的 计 
数 器 值 ， 每 次 计数 器 值 增 加 1 时 ， 打 印 是 哪 一 个 进程 〈 子 进程 或 父 进程 ) 进行 了 该 增加 
1 操作 。 

10.7 在 图 10-25 中 ， 若 调用 者 捕捉 了 SIGABRT 并 从 该 信号 处 理 程 序 中 返回 ， 为 什么 不 是 仅仅 调 
用 _exit， 而 要 恢复 其 默认 设置 并 再 次 调用 kill? 

10.8 为 什么 在 siginfo AW (A 10.14 35) 的 si uid 字段 中 包括 实际 用 户 ID 而 非 有 效用 


P! ID? 
109 重 写 图 10-14 中 的 函数 ， 要 求 它 处 理 图 10-1 中 的 所 有 信和 号， 每 次 循环 处 理 当 前 信号 屏蔽 字 
中 的 一 个 信号 〈 并 不 是 对 每 一 个 可 能 的 信和 号 都 循环 一 次 )。 


10.10 编写 一 段 程序 ， 要 求 在 一 个 无 限 循环 中 调用 sieep (60) 函数 ， 每 5 分 钟 CBE 5 次 循环 ) 
取 当 前 的 日 期 和 时 间 ， 并 打印 tm sec 字段 。 将 程序 执行 一 晚上 ， 请 解释 其 结果 。 有 些 程 
序 ， 如 cron 守护 进程 ， 每 分 钟 运行 一 次 ， 它 是 如 何 处 理 这 类 工作 的 ? 

10.11 修改 图 3-5 的 程序 ， 要 求 : (a) 将 BUFFSIZE AA 100; (b) 用 signal intr MR 
#2 sIGXFSZ 信号 量 并 打印 消息 ， 然 后 从 信号 处 理 程序 中 返回 ;(c) 如 果 没 有 号 满 请 求 
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的 字 节 数 ， 则 打印 write 的 返回 值 。 将 软 资 源 限 制 RLIMIT FSIZE (A 7.1] $5) 更 改 为 
1024 字 节 《在 shell 中 设置 软 资源 限制 ， 如 果 不 行 就 直接 在 程序 中 调用 setrlimit)， 然 
后 复制 一 个 大 于 1024 字 节 的 文件 , 在 各 种 不 同 的 系统 上 运行 新 程序 , 其 结果 如 何 ? 为 什么 ? 
10.12 编写 一 段 调用 fwrite 的 程序 ， 它 使 用 一 个 较 大 的 缓冲 区 (41GB), WA fwrite 前 调 
用 alarm 使 得 1s 以 后 产生 信和 号。 在 信号 处 理 程 序 中 打印 捕 提 到 的 信号, 然后 返回 。 fwrite 
可 以 完成 吗 ? 结果 如 何 ? 





线程 





11.1 引言 


在 前 面 的 章节 中 讨论 了 进程 ， 学 习 了 UNIX 进程 的 环境 、 进 程 间 的 关系 以 及 控制 进程 的 不 同 
方式 。 可 以 看 到 在 相关 的 进程 间 可 以 存在 一 定 的 共享 。 

本 章 将 进一步 深入 理解 进程 ， 了 解 如何 使 用 多 个 控制 线程 (或 者 简单 地 说 就 是 线程 》 在 单 进 
程 环境 中 执行 多 个 任务 。 一 个 进程 中 的 所 有 线程 都 可 以 访问 该 进程 的 组 成 部 件 ， 如 文件 描述 符 和 
内 存 。 

不 管 在 什么 情况 下 ， 只 要 单个 资源 需要 在 多 个 用 户 间 共享 ， 就 必须 处 理 一 致 性 问题 。 本 章 的 
最 后 将 讨论 目前 可 用 的 同步 机 制 ， 防 止 多 个 线程 在 共享 资源 时 出 现 不 一 致 的 问题 。 


1.2 线程 概念 


典型 的 UNIX 进程 可 以 看 成 只 有 一 个 控制 线程 : 一 个 进程 在 某 一 时 刻 只 能 做 一 件 事 情 。 有 了 
多 个 控制 线程 以 后 ， 在 程序 设计 时 就 可 以 把 进程 设计 成 在 某 一 时 刻 能 够 做 不 止 一 件 事 ， 每 个 线程 
处 理 各 自 独立 的 任务 。 这 种 方法 有 很 多 好 处 。 

© 通过 为 每 种 事件 类 型 分 配 单独 的 处 理 线程 ， 可 以 简化 处 理 异 步 事件 的 代码 。 每 个 线 
程 在 进行 事件 处 理 时 可 以 采用 同步 编程 模式 ， 同 步 编 程 模式 要 比 异 步 编 程 模式 简单 
得 多 。 

。 多 个 进程 必须 使 用 操作 系统 提供 的 复杂 机 制 才 能 实现 内 存 和 文件 描述 符 的 共享 ， 我 们 将 
在 第 15 章 和 第 17 章 中 学 习 这 方面 的 内 容 。 而 多 个 线程 自动 地 可 以 访问 相同 的 存储 地 址 
空间 和 文件 描述 符 。 

。 有 些 问题 可 以 分 解 从 而 提高 整个 程序 的 吞吐 量 。 在 只 有 一 个 控制 线程 的 情况 下 ， 一 个 单 
线程 进程 要 完成 多 个 任务 ， 只 需要 把 这 些 任务 串 行 化 。 但 有 多 个 控制 线程 时 ， 相 互 独立 
的 任务 的 处 理 就 可 以 交叉 进行 ， 此 时 只 需要 为 每 个 任务 分 配 一 个 单独 的 线程 。 当 然 只 有 
在 两 个 任务 的 处 理 过 程 互 不 依赖 的 情况 下 ， 两 个 任务 才 可 以 交叉 执行 。 

。 交互 的 程序 同样 可 以 通过 使 用 多 线程 来 改善 响应 时 间 ， 多 线程 可 以 把 程序 中 处 理 用 户 输 
入 输出 的 部 分 与 其 他 部 分 分 开 。 

有 些 人 把 多 线程 的 程序 设计 与 多 处 理 器 或 多 核 系统 联系 起 来 。 但 是 即使 程序 运行 在 单 处 理 器 

上 ， 也 能 得 到 多 线程 编程 模型 的 好 处 。 处 理 器 的 数量 并 不 影响 程序 结构 ， 所 以 不 管 处 理 器 的 个 数 
多 少 ， 程 序 都 可 以 通过 使 用 线程 得 以 简化 。 而 且 ， 即 使 多 线程 程序 在 串 行 化 任务 时 不 得 不 阻塞 ， 
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由 于 某 些 线程 在 阻塞 的 时 候 还 有 另外 一 些 线程 可 以 运行 ， 所 以 多 线程 程序 在 单 处 理 器 上 运行 还 是 
可 以 改善 响应 时 间 和 吞吐 量 。 

每 个 线程 都 包含 有 表示 执行 环境 所 必需 的 信息 ,其 中 包括 进程 中 标识 线程 的 线程 ID、 一 组 寄 
存 器 值 、 栈 、 调 度 优 先 级 和 策略 、 信 和 号 屏蔽 字 、errno 变量 ( 见 1.7 节 〉 以 及 线程 私有 数据 ( 见 
12.6 节 )。 一 个 进程 的 所 有 信息 对 该 进程 的 所 有 线程 都 是 共享 的 ， 包 括 可 执行 程序 的 代码 、 程 序 
的 全 局 内 存 和 堆 内 存 、 栈 以 及 文件 描述 符 。 

我 们 将 要 讨论 的 线程 接口 来 自 POSIX.1-2001。 线程 接 口 也 称 为 “pthread” 或 “POSIX 线程 ”， 
原来 在 POSIX.1-2001 中 是 一 个 可 选 功能 ， 但 后 来 SUSv4 把 它们 放 入 了 基本 功能 。POSIX 线程 的 
功能 测试 宏 是 _POSTX_THREADS。 应 用 程序 可 以 把 这 个 宏 用 于 #ifdef 测试 ， 从 而 在 编译 时 确定 
是 否 支 持 线 程 ; 也 可 以 把 _sSC_THREADS 常数 用 于 调用 sysconf 函数 ,进而 在 运行 时 确定 是 否 支 
持 线 程 。 遵 循 SUSv4 的 系统 定义 符号 _POSIX_THREADS 的 值 为 200809L. 


11.3 ”线程 标识 


就 像 每 个 进程 有 一 个 进程 DD 一样 , 每 个 线程 也 有 一 个 线程 也。 进程 ID 在 整个 系统 中 是 唯一 
的 ， 但 线程 ID 不 同 ， 线 程 ID 只 有 在 它 所 属 的 进程 上 下 文中 才 有 意义 。 
回忆 一 下 进程 ID, EA pid_t 数据 类 型 来 表示 的 ， 是 一 个 非 负 整 数 。 AE ID EH pthread_t 
数据 类 型 来 表示 的 ， 实 现 的 时 候 可 以 用 一 个 结构 来 代表 pthread t 数据 类 型 ， 所 以 可 移植 的 操作 
系统 实现 不 能 把 它 作为 整数 处 理 。 因 此 必须 使 用 一 个 函数 来 对 两 个 线程 ID 进行 比较 。 
#include <pthread.h> 


int pthread equal(pthread t tid], pthread t tid2); 


返回 值 : 若 相 等 ， 返 回 非 0 数值 否则， 返回 0 





Linux 3.2.0 使 用 无 符号 长 整 型 表示 pthread t 数据 类 型 。Solaris 10 把 pthread t 数据 类 
型 表示 为 无 符号 整 型 。FreeBSD 8.0 和 Mac OS X 10.6.8 用 一 个 指向 pthread 结构 的 指针 来 表示 
pthread 七 数据 类 型 。 


用 结构 表示 pthread t 数据 类 型 的 后 果 是 不 能 用 一 种 可 移植 的 方式 打印 该 数据 类 型 的 值 。 
在 程序 调试 过 程 中 打印 线程 ID 有 时 是 非常 有 用 的 ， 而 在 其 他 情况 下 通常 不 需要 打印 线程 ID。 最 
坏 的 情况 是 ， 有 可 能 出 现 不 可 移植 的 调试 代码 ， 当 然 这 也 算 不 上 是 很 大 的 局 限 性 。 
线程 可 以 通过 调用 pthread self 函数 获得 自身 的 线程 ID。 


#include <pthread.h> 


pthread_t pthread_self (void); 





返回 值 ， 调 用 线程 的 线程 ID 


当 线 程 需 要 识别 以 线程 ID 作为 标识 的 数据 结构 时 ，pthreaqd_self 函数 可 以 与 Pthread_ 
equal 函数 一 起 使 用 。 例 如 ， 主 线程 可 能 把 工作 任务 放 在 一 个 队列 中 ， 用 线程 ID 来 控制 每 个 工 
作 线 程 处 理 哪些 作业 。 如 图 11-1 所 示 ， 主 线程 把 新 的 作业 放 到 一 个 工作 队列 中 ， 由 3 个 工作 线程 
组 成 的 线程 池 从 队列 中 移出 作业 。 主 线程 不 允许 每 个 线程 任意 处 理 从 队列 顶端 取出 的 作业 ， 而 是 
由 主线 程控 制作 业 的 分 配 ， 主 线程 会 在 每 个 待 处 理 作业 的 结构 中 放置 处 理 该 作业 的 线程 ID, 每 个 
工作 线程 只 能 移出 标 有 自己 线程 ID 的 作业 。 
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1-1. 工作 队列 实例 
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在 传统 UNIX 进程 模型 中 ， 每 个 进程 只 有 一 个 控制 线程 。 从 概念 上 讲 ， 这 与 基于 线程 的 模型 
中 每 个 进程 只 包含 一 个 线程 是 相同 的 。 在 POSIX 线程 (pthread) 的 情况 下 ,程序 开始 运行 时 ， 它 
也 是 以 单 进程 中 的 单个 控制 线程 启动 的 。 在 创建 多 个 控制 线程 以 前 ， 程 序 的 行为 与 传统 的 进程 并 
没有 什么 区 别 。 新 增 的 线程 可 以 通过 调用 pthread_create 函数 创建 。 


#include «pthread.h» 


int pthread create(pthread t *restrict fidp, 
const pthread attr t *restrict atir, 


void * (*starf_rin) (void *), void *restrict arg): 


RA: AR. EO, TM. BERRA 





“4 pthread_create 成 功 返 回 时 ， 新 创建 线程 的 线程 ID 会 被 设置 成 tidp 指向 的 内 存单 元 。 
attr 参数 用 于 定制 各 种 不 同 的 线程 属性 。 我 们 将 在 12.3 节 中 讨论 线程 属性 ， 但 现在 我 们 把 它 置 为 
NULL， 创 建 一 个 具有 默认 属性 的 线程 。 

新 创建 的 线程 从 start rtn 函数 的 地 址 开始 运行 ， 该 函数 只 有 一 个 无 类 型 指针 参数 arg. WR 
需要 向 start rtn 函数 传递 的 参数 有 一 个 以 上 ， 那 么 需要 把 这 些 参 数 放 到 一 个 结构 中 ， 然 后 把 这 个 
结构 的 地 址 作为 arg 参数 传 入 。 

线程 创建 时 并 不 能 保证 哪个 线程 会 先 运行 ， 是 新 创建 的 线程 ， 还 是 调用 线程 。 新 创建 的 线程 
可 以 访问 进程 的 地 址 空间 ， 并 且 继 承 调 用 线程 的 浮 点 环境 和 信和 号 屏蔽 字 ， 但 是 该 线程 的 挂 起 信和 号 
集会 被 清除 。 

YER, pthread 函数 在 调用 失败 时 通常 会 返回 错误 码 ， 它 们 并 不 像 其 他 的 POSIX 函数 -- 样 设 
置 errno。 每 个 线程 都 提供 errno 的 副本 ， 这 只 是 为 了 与 使 用 errno 的 现 有 函数 兼容 。 在 线程 
中 ， 从 函数 中 返回 错误 码 更 为 清晰 整洁 ， 不 需要 依赖 那些 随 着 函数 执行 不 断 变化 的 全 局 状态 ， 这 
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样 可 以 把 错误 的 范围 限制 在 引起 出 错 的 函数 中 。 


时 实例 


虽然 没有 可 移植 的 打印 线程 ID 的 方法 ， 但 是 可 以 写 一 个 小 的 测试 程序 来 完成 这 个 任务 ， 以 
便 更 深入 地 了 解 线程 是 如 何 工作 的 。 图 11-2 中 的 程序 创建 了 一 个 线程 ， 打 印 了 进程 DD、 新 线程 
的 线程 ID 以 及 初始 线程 的 线程 ID。 


#include "apue.nh" 
#include <pthread.h> 


pthread t ntid; 


void 
printids(const char *s) 
{ 
pid t pid; 
pthread t tid; 


pid = getpid(); 
tid = pthread self(); 
printf("$s pid lu tid tlu (Ox$1x)Wn", s, (unsigned long)pid, 
(unsigned long)tid, (unsigned long)tid); 
} 


void * 

thr_fn(void *arg) 

{ 
printids("new thread: "); 
return( (void *)0); 


} 


int 
main (void) 
{ 


int err; 


err = pthread create(&ntid, NULL, thr fn, NULL); 
if (err != 0) 

err exit(err, "can't create thread"); 
printids ("main thread:"); 
sleep (1); 
exit(0); 


11-2 ”打印 线程 ID 
这 个 实例 有 两 个 特别 之 处 ， 需 要 处 理 主线 程 和 新 线程 之 闻 的 竞争 。( 我 们 将 在 这 章 后 面 的 内 
容 中 学 习 如 何 更 好 地 处 理 这 种 竞争 。) 第 一 个 特别 之 处 在 于 ， 主 线程 需要 休眠 ， 如 果 主 线程 不 休 
卢 ， 它 就 可 能 会 退出 ， 这 样 新 线程 还 没有 机 会 运行 ， 整 个 进程 可 能 就 已 经 终止 了 。 这 种 行为 特征 
依赖 于 操作 系统 中 的 线程 实现 和 调度 算法 。 
第 二 个 特别 之 处 在 于 新 线程 是 通过 调用 pthread self 函数 获取 自己 的 线程 ID 的 , 而 不 是 
从 共享 内 存 中 读 出 的 ， 或 者 从 线程 的 启动 例 程 中 以 参数 的 形式 接收 到 的 。 回 忆 pthread create 
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函数 ， 它 会 通过 第 一 个 参数 (tidp) 返回 新 建 线程 的 线程 ID。 在 这 个 例子 中 ， 主 线程 把 新 线程 ID 
存放 在 ntid 中 ， 但 是 新 建 的 线程 并 不 能 安全 地 使 用 它 ， 如 果 新 线程 在 主线 程 调 用 
pthread_create 返回 之 前 就 运行 了 , 那么 新 线程 看 到 的 是 未 经 初始 化 的 ntia 的 内 容 , 这 个 内 
容 并 不 是 正确 的 线程 ID。 

在 Solaris 上 运行 图 11-2 中 的 程序 ， 得 到 : 

$ ./a.out 


main thread: pid 20075 tid 1 (0x1) 
new thread: pid 20075 tid 2 (0x2) 


正如 我 们 期 望 的， 两 个 线程 的 进程 ID 相同 ， 但 线程 ID 不同。 在 FreeBSD 上 运行 图 11-2 中 的 程 
序 ， 得 到 : 
$ ./a.out 


main thread: pid 37396 tid 673190208 (0x28201140) 
new thread: pid 37396 tid 673280320 (0x28217140) 


也 如 我 们 期 望 的 ， 两 个 线程 有 相同 的 进程 ID。 如 果 把 线程 ID 看 成 是 十 进 制 整 数 ， 那 么 这 两 个 值 
看 起 来 很 奇怪 ,但 是 如 果 把 它们 转化 成 十 六 进 制 ， 看 起 来 就 更 合理 了 。 就 像 前 面 提 到 的 , FreeBSD 
使 用 指向 线程 数据 结构 的 指针 作为 它 的 线程 ID. 

我 们 期 望 Mac OS X 与 FreeBSD 相似 , 但 事实 上 , 在 Mac OS X 中 , 主线 程 ID 与 用 pthread_ 
create 新 创建 的 线程 的 线程 ID 不 在 相同 的 地 址 范围 内 : 


S ./a.out 
main thread: pid 31807 tid 140735073889440 (Ox7fff70162ca0) 
new thread: pid 31807 tid 4295716864 (0x1000b7000) 


相同 的 程序 在 Linux 上 运行 得 到 : 


$ ./a.out 
main thread: pid 17874 tid 140693894424320 (0x7ff5d9996700) 
new thread: pid 17874 tid 140693886129920 (0x7ff5d91aqd700) 


尽管 Linux 线程 ID 是 用 无 符号 长 整 型 来 表示 的 ， 但 是 它们 看 起 来 像 指 针 。 


Linux 2.4 fe Linux 2.6 在 线程 实现 上 是 不 同 的 。Linux 2.4 P, LinuxThreads 是 用 单独 的 进程 实 
， 现 每 个 线程 的 ， 这 使 得 它 很 难 与 POSIX 线程 的 行为 匹配 。Linux 2.6 中 ,对 Linux 内 核 和 线程 库 进 
行 了 很 大 的 修改 ， 采 用 了 一 个 称 为 Native POSIX 线程 库 ( Native POSIX Thread Library, NPTL ) 
的 新 线程 实现 。 它 支持 单个 进程 中 有 多 个 线程 的 模型 ， 也 更 容易 支持 POSIX RAHEL M 
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如 果 进 程 中 的 任意 线程 调用 了 exit. Exit 或 者 exit， 那 么 整个 进程 就 会 终止 。 与 此 相 
类 似 ， 如 果 默 认 的 动作 是 终止 进程 ， 那 么 ， 发 送 到 线程 的 信号 就 会 终止 整个 进程 〈12.8 节 将 讨论 
信和 号 与 线程 间 是 如 何 交互 的 )。 

单个 线程 可 以 通过 3 种 方式 退出 ， 因 此 可 以 在 不 终止 整个 进程 的 情况 下 ， 停 止 它 的 控制 流 。 

(1) 线程 可 以 简单 地 从 启动 例 程 中 返回 ， 返 回 值 是 线程 的 退出 码 。 

(2) 线程 可 以 被 同一 进程 中 的 其 他 线程 取消 。 

(3) 线程 调用 pthread exit. 
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#include «pthread.h» 
void pthread exit(void *rval ptr); 
mal ptr 参数 是 一 个 无 类 型 指针 ， 与 传 给 启动 例 程 的 单个 参数 类 似 。 进 程 中 的 其 他 线程 也 可 
以 通过 调用 pthread_join 函数 访问 到 这 个 指针 。 


#include <pthread.h> 


int pthread join(pthread t thread, void **rval ptr) ; 





返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


调用 线程 将 一 直 阻 塞 , 直到 指定 的 线程 调用 pthread_exit、 从 启动 例 程 中 返回 或 者 被 取消 。 
如 果 线 程 简单 地 从 它 的 启动 例 程 返 回 ，rval_ptr 就 包含 返回 码 。 如 果 线 程 被 取消 ， 由 rval_ptr 指定 
的 内 存单 元 就 设置 为 PTHREAD_CANCELED。 

可 以 通过 调用 pthread_join 自动 把 线程 置 于 分 离 状 态 (马上 就 会 讨论 到 )， 这样 资 源 就 可 
以 恢复 。 如 果 线 程 已 经 处 于 分 离 状 态 ，pthread_join 调用 就 会 失败 ， 返 回 EINVAL， 尽 管 这 种 
行为 是 与 具体 实现 相关 的 。 

如 果 对 线程 的 返回 值 并 不 感 兴趣 ， 那 么 可 以 把 mval ptr 设置 为 NULL。 在 这 种 情况 下 ， 调 用 
pthread join 函数 可 以 等 待 指定 的 线程 终止 ， 但 并 不 获取 线程 的 终止 状态 。 


"n 实例 
11-3 展示 了 如 何 获取 已 终止 的 线程 的 退出 码 。 


#include "apue.h" 
#include <pthread.h> 


void * 

thr fnl(void *arg) 

{ 
printf("thread 1 returning\n"); 
return((void *)1); 

i 


void * 

thr fn2(void *arg) 

{ 
printf ("thread 2 exiting\n"); 
pthread exit((void *)2); 

} 


int 
main (void) 
{ 


int err; 
pthread_t tidl, tid2; 
void *tret; 


err = pthread create(&tidl, NULL, thr fni, NULL); 
if (err !- 0) 

err exit(err, "can't create thread 1"); 
err - pthread create(&tid2, NULL, thr fn2, NULL); 
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if (err t= 0) 

err exit(err, "can't create thread 2"); 
err = pthread join(tidl, &tret); 
if (err != Q) 

err exit(err, "can't join with thread 1"); 
printf ("thread 1 exit code %ld\n", (long)tret); 
err = pthread join(tid2, &tret); 
if (err != 0) 

err exit(err, "can't join with thread 2"); 
printf("thread 2 exit code $1dMn", (long)tret); 
exit (0); 


图 11-3 ”获得 线程 退出 状态 
运行 图 11-3 中 的 程序 ， 得 到 的 结果 是 : 


$ ./a.out 

thread 1 returning 
thread 2 exiting 
thread 1 exit code i 
thread 2 exit code 2 


可 以 看 到 ， 当 一 个 线程 通过 调用 pthread_exit 退出 或 者 简单 地 从 启动 例 程 中 返回 时 ， 证 程 中 的 
其 他 线程 可 以 通过 调用 pthread. join 函数 获得 该 线程 的 退出 状态 。 a" 


pthread create fl pthread exit 函数 的 无 类 型 指针 参数 可 以 传递 的 值 不 止 一 个 ,这 个 
指针 可 以 传递 包含 复杂 信息 的 结构 的 地 址 ， 但 是 注意 ， 这 个 结构 所 使 用 的 内 存在 调用 者 完成 调用 
以 后 必须 仍然 是 有 效 的 。 例 如 ， 在 调用 线程 的 栈 上 分 配 了 该 结构 ， 那 么 其 他 的 线程 在 使 用 这 个 结 
构 时 内 存 内 容 可 能 已 经 改变 了 。 又 如 ， 线 程 在 自己 的 栈 上 分 配 了 一 个 结构 ， 然 后 把 指向 这 个 结构 
的 指针 传 给 pthread_exit， 那 么 调用 pthread join 的 线程 试图 使 用 该 结构 时 ， 这 个 栈 有 可 
能 已 经 被 撤销 ， 这 块 内 存 也 已 另 作 他 用 。 


二 实例 
图 11-4 中 的 程序 给 出 了 用 自动 变量 (分配 在 栈 上 ) 作为 pthread_exit 的 参数 时 出 现 的 问题 。 


finclude "apue.n" 
#include <pthread.h> 


struct foo { 
int a, b, c, d; 


void 
printfoo(const char *s, const struct foo *fp) 
{ 
printf ("%s", s); 
printf(" structure at Ox%lx\n", (unsigned long) fp); 
printf(" foo.a d\n", fp->a); 
printf(" foo.b = %d\n", fp->b); 
printf(" foo.c d\n", fp->c); 
printf(" foo.d d\n", fp-»d); 
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void * 
thr fnl(void *arg) 


í 


struct foo foo = (1, 2, 3, 4); 


printfoo("thread 1:\n", &f00); 
pthread exit((void *)&foo); 


void * 
thr fn2(void *arg) 


{ 


int 


printf("thread 2: ID is $1uMn", (unsigned long)pthread self ()); 
pthread exit((void *)0); 


main(void) 


( 


int err; 
pthread t tidl, tid2; 
struct foo *fp; 


err = pthread create(&tidl, NULL, thr_fnl, NULL); 
if (err != 0) 

err_exit(err, "can't create thread 1"); 
err = pthread join(tidl, (void *)&fp); 
if (err !- 0) 

err exit(err, "can't join with thread 1"); 
sleep(í1); 
printf ("parent starting second thread\n"); 
err = pthread create(&tid2, NULL, thr fn2, NULL); 
if (err != 0} 

err exit(err, "can't create thread 2"); 
sleepí1); 
printfoo({"parent:\n", fp): 
exit(0); 


11-4 pthread exit 参数 的 不 正确 使 用 
在 Linux 上 运行 此 程序 ， 得 到 : 


S ./a.out 
thread 1: 
structure at 0x7f2c83682edO0 
foo.a- 1 
foo.b = 2 
foo.c = 3 
foo.d = 4 


parent starting second thread 
thread 2: ID is 139829159933696 


parent: 
structure at Ox7f2c83682ed0 
foo.a = -2090321472 
foo.b = 32556 
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foo.c 
foo.d 


当然 ， 运 行 结果 根据 内 存 体 系 结构 、 编 译 器 以 及 线程 库 的 实现 会 有 所 不 同 。 在 Solaris 上 的 结果 
类 似 : 


yo 


O e 


$ ./a.out 
thread 1: 
structure at OÜxffffffff7fÜfbf30 
foo.a = 1 
foo.b = 2 
foo.c = 3 
foo.d = 4 


parent starting second thread 
thread 2: ID is 3 


parent: 
structure at Oxffffffff7f0fbf30 
foo.a = -1 
foo.b - 2136969048 
foo.c = -1 
foo.d = 2138049024 


可 以 看 到 ， 当 主线 程 访问 这 个 结构 时 ， 结 构 的 内 容 〈 在 线程 nd] 的 栈 上 分 配 的 ) 已 经 改变 了 。 注 

意 第 二 个 线程 〈iid2) 的 栈 是 如 何 覆 盖 第 一 个 线程 的 栈 的 。 为 了 解决 这 个 问题 ， 可 以 使 用 全 局 结 

构 ， 或 者 用 malloc 函数 分 配 结构 。 392 
在 Mac OS X 上 运行 的 结果 有 所 不 同 : 


$ ,/a.out 
thread 1: 

structure at 0x1000b6f00 

foo.a 1 

foo.b 2 

foo.c 3 

foo.d 4 
parent starting second thread 
thread 2: ID is 4295716864 
parent: 

structure at Ox1000b6f00 
Segmentation fault (core dumped) 


在 这 种 情况 下 ， 父 进程 试图 访问 已 退出 的 第 一 个 线程 传 给 它 的 结构 时 ， 内 存 不 再 有 效 ， 这 时 得 到 
的 是 SIGSEGV 信号 。 
FreeBSD 上 ， 父 进程 访问 内 存 时 ， 内 存 并 没有 被 覆 写 ， 得 到 的 结果 是 : 


[| 


thread 1: 
structure at Üxbf9fef88 
foo.a = 1 
foo.b = 2 
foo.c = 3 
foo.d = 4 


parent starting second thread 
thread 2: ID is 673279680 
parent: 
structure at Oxbf9fef88 
foo.a = 1 
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foo.b = 2 
foo.c = 3 
foo.d = 4 

虽然 线程 退出 后 ， 内 存 依然 是 完整 的 ， 但 我 们 不 能 期 望 情况 总 是 这 样 的 。 从 其 他 平台 上 的 结 

果 中 可 以 看 出 ， 情 况 并 不 都 是 这 样 的 。 € 


线程 可 以 通过 调用 pthread cancel 函数 来 请 求 取消 同一 进程 中 的 其 他 线程 。 


#include «pthread.h» 


int pthread cancel(pthread t (id); 


返回 值 ， 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错 误 编 号 





在 默认 情况 下 ，pthread_cancel 函数 会 使 得 由 nd 标识 的 线程 的 行为 表现 为 如 同调 用 了 参数 

为 PTHREAD CANCELED 的 pthread exit 函数 ， 但 是 ， 线 程 可 以 选择 忽略 取消 或 者 控制 如 何 被 
取消 。 我 们 将 在 12.7 节 中 详细 讨论 。 注意 pthread_cancel 并 不 等 待 线程 终止 ， 它 仅仅 提出 请 求 。 
线程 可 以 安排 它 退 出 时 需要 调用 的 函数 , 这 与 进程 在 退出 时 可 以 用 atexit 函数 ( 见 7.3 4) 
安排 退出 是 类 似 的 。 这 样 的 函数 称 为 线程 清理 处 理 程序 (thread cleanup handler)。 一 个 线程 可 以 
建立 多 个 清理 处 理 程 序 。 处 理 程序 记录 在 栈 中 ， 也 就 是 说 ， 它 们 的 执行 顺序 与 它们 注册 时 相反 。 


$include «pthread.h» 


void pthread cleanup push(void (*rtm) (void *), void *arg); 





void pthread cleanup pop(int execute) ; 


当 线 程 执行 以 下 动作 时 ， 清 理 函 数 rm déHipthread cleanup push 函数 调度 的 ， 调 用 时 
只 有 一 个 参数 arg: 

e 调用 pthread_exit Hj; 

。 响应 取消 请 求 时 ，; 

。 用 非 零 execute 参数 调用 pthread_cleanup_pop Hj. 

WR execute 参数 设置 为 0， 清 理 函 数 将 不 被 调用 。 不 管 发 生 上 述 哪 种 情况 ，pthread_ 
cleanup pop 都 将 删除 上 次 pthread_cleanup_push 调用 建立 的 清理 处 理 程序 。 

这 些 函 数 有 一 个 限制 ， 由 于 它们 可 以 实现 为 宏 ， 所 以 必须 在 与 线程 相同 的 作用 域 中 以 匹配 对 
的 形式 使 用 。pthread_cleanup_push 的 宏 定义 可 以 包含 字符 { ， 这 种 情况 下 ， 在 pthread_ 
cleanup. pop 的 定义 中 要 有 对 应 的 匹配 字符 )} 。 


"实例 


11-5 给 出 了 一 个 如 何 使 用 线程 清理 处 理 程序 的 例子 。 虽 然 例子 是 人 为 编造 的 , 但 它 描 述 了 
其 中 涉及 的 清理 机 制 。 注 意 ， 虽 然 我 们 从 来 没 想 过 要 传 一 个 参数 0 给 线程 局 动 例 程 ， 但 还 是 需要 
把 pthread cleanup pop 调用 和 pthread_cleanup_pusn 调用 匹配 起 来 ， 否 则 ， 程 序 编译 
就 可 能 通 不 过 。 


#include "apue.h" 
#include <pthread.h> 


void 
cleanup (void *arg) 


{ 
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printf("cleanup: %s\n", (char *)arg); 


void * 
thr fnl(void *arg) 
{ 
printf("thread 1 start\n"); 
pthread_cleanup_push(cleanup, "thread 1 first handler"); 
pthread cleanup push (cleanup, "thread 1 second handler"); 
printf ("thread 1 push complete\n"); 
if (arg) 
return{ (void *)1); 
pthread cleanup pop(0); 
pthread cleanup pop (0); 
return((void *)1); 


void * 
thr fn2(void *arg) 
{ 
printf ("thread 2 start\n"); 
pthread cleanup push(cleanup, "thread 2 first handler"); 
pthread cleanup push(cleanup, "thread 2 second handler"); 
printf("thread 2 push complete\n"); 
if (arg) 
pthread exit((void *)2); 
pthread cleanup pop (0); 
pthread cleanup pop (0); 
pthread exit((void *)2); 


int 
main (void) 
{ 


int err; 
pthread_t tidl, tid2; 
void *tret; 


err = pthread create(&tidl, NULL, thr fnl, (void *)1); 
if (err !- 0} 
err exit(err, "can't create thread 1"); 
err = pthread create(&tid2, NULL, thr fn2, (void *)1); 
if (err != 0) 
err exit(err, "can't create thread 2"); 
err = pthread join(tidl, &tret); 
if (err != 0) 
err exit(err, "can't join with thread 1"); 
printf ("thread 1 exit code $1dMn", (long)tret); 
err = pthread join(tid2, &tret); 
if (err != 0) 
err exit(err, "can't join with thread 2"); 
printf ("thread 2 exit code $1dWMn", (long)tret); 
exit (0); 
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在 Linux 或 者 Solaris. 上 运行 图 11-5 中 的 程序 会 得 到 ，; 


$ ./a.out 

thread 1 start 

thread 1 push complete 

thread 2 start 

thread 2 push complete 

cleanup: thread 2 second handler 
cleanup: thread 2 first handler 
thread 1 exit code 1 

thread 2 exit code 2 


从 输出 结果 可 以 看 出 ， 两 个 线程 都 正确 地 启动 各 退出 了 ， 但 是 只 有 第 二 个 线程 的 清理 处 理 程 
序 被 调用 了 。 因 此 ， 如 果 线 程 是 通过 从 它 的 启动 例 程 中 返回 而 终止 的 话 ， 它 的 清理 处 理 程序 就 不 
会 被 调用 。 还 要 注意 ， 清 理 处 理 程 序 是 按照 与 它们 安装 时 相反 的 顺序 被 调用 的 。 

如 果 在 FreeBSD 或 者 Mac OS X 上 运行 相同 的 程序 ， 可 以 看 到 程序 会 出 现 段 异常 并 产生 core 
文件 。 这 是 因为 在 这 两 个 平台 上 ，pthread_cleanuP_push 是 用 宏 实现 的 ， 而 宏 把 某 些 上 下 文 
存放 在 栈 上 。 当 线程 1 在 调用 pthread_cleanup_push 和 调用 pthread cleanup pop 之 间 
BAN, 栈 已 被 改写 , 而 这 两 个 平台 在 调用 清理 处 理 程序 时 就 用 了 这 个 被 改写 的 上 下 文 。 在 Single 
UNIX Specification 中 ， 函 数 如 果 在 调用 pthread_cleanup_push Ñ pthread_cleanup_pop 
之 间 返 回 ， 会 产生 未 定义 行为 。 唯 一 的 可 移植 方法 是 调用 pthread_exit. a 


现在 , LRN TE FRR BR a AA &b. 11-6 总 结 了 这 些 相似 的 函数 。 


fork pthread, create 创建 新 的 控制 流 
exit pthread exit 从 现 有 的 控制 流 中 退出 


waitpid pthread join 从 控制 流 中 得 到 退出 状态 
atexit pthread cancel push 注册 在 退出 控制 流 时 调用 的 函数 
getpid pthread self 获取 控制 流 的 ID 

abort pthread cancel 请 求 控 制 流 的 非 正 常 退出 


图 11-6 ”进程 和 线程 原 语 的 比较 
在 默认 情况 下 , 线程 的 终止 状态 会 保存 直到 对 该 线程 调用 pthread_join。 如 果 线 程 已 经 被 
分 离 ， 线 程 的 底层 存储 资源 可 以 在 线程 终止 时 立即 被 收回 。 在 线程 被 分 离 后， 我 们 不 能 用 
pthread join 函数 等 待 它 的 终止 状态 ， 因 为 对 分 离 状态 的 线程 调用 pthread join 会 产生 未 
定义 行为 。 可 以 调用 pthread_detach 分 离线 程 。 


#include «pthread.h» 





int pthread detach(pthread t fid}; 


返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


在 下 一 章 里 ， 我 们 将 学 习 通 过 修改 传 给 pthread create 函数 的 线程 属性 ， 创 建 一 个 已 处 
于 分 离 状态 的 线程 。 


11.6 ”线程 同步 


当 多 个 控制 线程 共享 相同 的 内 存 时 ， 需 要 确保 每 个 线程 看 到 一 致 的 数据 视图 。 如 果 每 个 线程 
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使 用 的 变量 都 是 其 他 线程 不 会 读 取 和 修改 的 ， 那 么 就 不 存在 一 致 性 问题 。 同 样 ， 如 果 变 量 是 只 读 
的 ， 多 个 线程 同时 读 取 该 变量 也 不 会 有 一 致 性 问题 。 但 是 ， 当 一 个 线程 可 以 修改 的 变量 ， 其 他 线 
程 也 可 以 读 取 或 者 修改 的 时 候 , 我 们 就 需要 对 这 些 线程 进行 同步 , 确保 它们 在 访问 变量 的 存储 内 容 时 不 
会 访问 到 无 效 的 值 。 

当 一 个 线程 修改 变量 时 ， 其 他 线程 在 读 取 这 个 变量 时 可 能 会 看 到 一 个 不 一 致 的 值 。 在 变量 修 
改 时 间 多 于 一 个 存储 器 访问 周期 的 处 理 器 结构 中 ， 当 存储 器 读 与 存储 器 写 这 两 个 周期 交叉 时 ， 这 
种 不 一 致 就 会 出 现 。 当 然 ， 这 种 行为 是 与 处 理 器 体系 结构 相关 的 ， 但 是 可 移植 的 程序 并 不 能 对 使 
用 何 种 处 理 器 体系 结构 做 出 任何 假设 。 

图 11-7 描述 了 两 个 线程 读 写 相同 变量 的 假设 例子 。 在 这 个 例子 中 ， 线 程 A 读 取 变量 然后 给 
这 个 变量 赋予 一 个 新 的 数值 ， 但 写 操作 需要 两 个 存储 器 局 期 。 当 线程 B 在 这 两 个 存储 器 写 周 期 中 
间 读 取 这 个 变量 时 ， 它 就 会 得 到 不 一 致 的 值 。 

为 了 解决 这 个 问题 ,线程 不 得 不 使 用 锁 ， 同 一 时 间 只 允许 一 个 线程 访问 该 变量 。 图 11-8 描述 
了 这 种 同步 。 如 果 线程 B 希望 读 取 变量 ， 它 首先 要 获取 锁 。 同 样 ， 当 线程 A 更 新 变量 时 ， 也 需要 
获取 同样 的 这 把 锁 。 这 样 ， 线 程 B 在 线程 A 释放 锁 以 前 就 不 能 读 取 变 量 。 

ARA 线程 日 


线程 A 线程 B 





图 11-7 ”两 个 线程 的 交叉 存储 器 周期 图 11-8 两 个 线程 同步 内 存 访问 397 

两 个 或 多 个 线程 试图 在 同一 时 间 修 改 同 一 变量 时 ， 也 需要 进行 同步 。 考 虑 变量 增 量 操作 的 情 
D CB 11-9)， 增 量 操 作 通常 分 解 为 以 下 3 步 。 

C1) 从 内 存单 元 读 入 寄存 器 。 

(2) 在 寄存 器 中 对 变量 做 增 量 操 作 。 

(3) 把 新 的 值 写 回 内 存单 元 。 

如 果 两 个 线程 试图 几乎 在 同一 时 间 对 同一 个 变量 做 增 量 操作 而 不 进行 同步 的 话 ， 结 果 就 可 能 
出 现 不 一 致 ， 变 量 可 能 比 原来 增加 了 1， 也 有 可 能 比 原 来 增加 了 2， 具 体 增 加 了 1 还 是 2 要 取决 
于 第 二 个 线程 开始 操作 时 获取 的 数值 。 如 果 第 二 个 线程 执行 第 1 步 要 比 第 一 个 线程 执行 第 3 步 要 
早 ， 第 二 个 线程 读 到 的 值 与 第 一 个 线程 一 样 ， 为 变量 加 1， 然 后 写 回 去 ， 事 实 上 没有 实际 的 效果 ， 
总 的 来 说 变量 只 增加 了 1。 

如 果 修 改 操作 是 原子 操作 ， 那 么 就 不 存在 竞争 。 在 前 面 的 例子 中 ， 如 果 增 加 1 只 需要 一 个 存储 器 
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周期 ， 那 么 就 没有 竞争 存在 。 如 果 数据 总 是 以 顺序 一 致 出 现 的 ， 就 不 需要 额外 的 同步 。 当 多 个 线程 观 
察 不 到 数据 的 不 一 致 时 ， 那 么 操作 就 是 顺序 一 致 的 。 在 现代 计算 机 系统 中 ， 存 储 访问 需要 多 个 总 线 周 
期 ， 多 处 理 器 的 总 线 周期 通常 在 多 个 处 理 器 上 是 交叉 的 ， 所 以 我 们 并 不 能 保证 数据 是 顺序 一 致 的 。 
线程 A ARB + 的 内 容 


i MARES 
(寄存 器 = 5) 


对 寄存 器 内 容 做 
(寄存 器 = 6) 


i WARE ; 
(寄存 器 = 5) 


«4 


时 间 


将 寄存 器 对 寄存 器 内 容 做 
AREA i 增 量 操作 6 
( 寄存 器 = 6) (寄存 器 = 6) 
将 寄存 器 
WAAL 6 
( 寄存 器 = 6) 


图 11-9 ”两 个 非 同 步 的 线程 对 同一 个 变量 做 增 量 操作 
在 顺序 一 致 环境 中 ， 可 以 把 数据 修改 操作 解释 为 运行 线程 的 顺序 操作 步骤 。 可 以 把 这 样 的 操 
作 描 述 为 “线程 A 对 变量 增加 了 1, 然后 线程 B 对 变量 增加 了 1, 所 以 变量 的 值 就 比 原来 的 大 2”, 
或 者 描述 为 “线程 B 对 变量 增加 了 1， 然 后 线程 A 对 变量 增加 了 1， 所 以 变量 的 值 就 比 原 来 的 大 
2”。 这 两 个 线程 的 任何 操作 顺序 都 不 可 能 让 变量 出 现 除 了 上 述 值 以 外 的 其 他 值 。 
除了 计算 机 体系 结构 以 外 , 程序 使 用 变量 的 方式 也 会 引起 竞争 , 也 会 导致 不 一 致 的 情况 发 生 。 
例如 ， 我 们 可 能 对 某 个 变量 加 1， 然 后 基于 这 个 值 做 出 某 种 决定 。 因 为 这 个 增 量 操作 步骤 和 这 个 
决定 步骤 的 组 合并 非 原 子 操作 ， 所 以 就 给 不 一 致 情况 的 出 现 提供 了 可 能 。 


11.6.1 HE 


可 以 使 用 pthread 的 互 斥 接口 来 保护 数据 ， 确 保 同 一 时 间 只 有 一 个 线程 访问 数据 。 互 斥 量 
(mutex) 从 本 质 上 说 是 一 把 锁 ， 在 访问 共享 资源 前 对 互 斥 量 进行 设置 《加 锁 )， 在 访问 完成 后 释 
K FG) 互 斥 量 。 对 互 斥 量 进 行 加 锁 以 后 ， 任 何其 他 试图 再 次 对 互 斥 量 加 锁 的 线程 都 会 被 阻塞 
直到 当前 线程 释放 该 互 斥 锁 。 如 果 释 放 互 斥 量 时 有 一 个 以 上 的 线程 阻塞 ， 那 么 所 有 该 锁 上 的 阻塞 
399] 线程 都 会 变 成 可 运行 状态 ， 第 一 个 变 为 运行 的 线程 就 可 以 对 互 斥 量 加 锁 ， 其 他 线程 就 会 看 到 互 斥 
量 依然 是 锁 着 的 ， 只 能 回去 再 次 等 待 它 重新 变 为 可 用 。 在 这 种 方式 下 ， 每 次 只 有 一 个 线程 可 以 向 

前 执行 。 
只 有 将 所 有 线程 都 设计 成 遵守 相同 数据 访问 规则 的 ， 互 斥 机 制 才能 正常 工作 。 操 作 系统 并 不 
会 为 我 们 做 数据 访问 的 串 行 化 。 如 果 人 允许 其 中 的 某 个 线程 在 没有 得 到 锁 的 情况 下 也 可 以 访问 共享 
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资源 ， 那 么 即使 其 他 的 线程 在 使 用 共享 资源 前 都 申请 锁 ， 也 还 是 会 出 现 数据 不 一 致 的 问题 。 

互 斥 变量 是 用 pthread mutex t 数据 类 型 表示 的 。 在 使 用 互 斥 变量 以 前 ， 必 须 首 先 对 它 进 
行 初始 化 ,可 以 把 它 设 置 为 常量 PTHRERAD_MUTEX_INITIRALIZER( 只 适用 于 静态 分 配 的 互 斥 量 )， 
也 可 以 通过 调用 pthread_mutex_init 函数 进行 初始 化 。 如 果 动 态 分 配 互 斥 量 〈 例 如 ， 通 过 调 
用 malloc 函数 )， 在 释放 内 存 前 怖 要 调用 pthread mutex destroy. 


#include <pthread.h> 


int pthread mutex init(pthread mutex t *restrict mutex, 


const pthread mutexattr t *restrict attr); 
int pthread mutex destroy(pthread mutex t *mutex); 
两 个 函数 的 返回 值 : AR, EO: 否则 ， 返 回 错误 编号 
要 用 默认 的 属性 初始 化 互 斥 量 ， 只 需 把 attr 设 为 NULL。 我 们 将 在 12.4 节 中 讨论 互 斥 量 
属性 。 
对 互 斥 量 进行 加 锁 ， 需 要 调用 pthread_mutex_Lock。 如 果 互 斥 量 已 经 上 锁 ， 调 用 线程 将 
阻塞 直到 互 斥 量 被 解锁 。 对 互 斥 量 解锁 ， 需 要 调用 pthread mutex unlock. 


#include <pthread.h> 





int pthread_mutex_lock(pthread_mutex_t *mutex); 


int pthread mutex trylock(pthread mutex t *mulex); 


int pthread mutex unlock(pthread mutex t *mutex); 


所 有 函数 的 返回 值 : 车 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 





如 果 线 程 不 希望 被 阻塞 ， 它 可 以 使 用 pthread mutex trylock 党 试 对 互 斥 量 进行 加 锁 。 
如 果 调 用 pthread mutex trylock 时 互 斥 量 处 于 未 锁 住 状态 ， 那 么 pthread mutex trylock 
将 锁 住 互 斥 量 ， 不 会 出 现 阻塞 直接 返回 0, AM pthread mutex trylock 就 会 失败 ， 不 能 锁 
HJE, RE] EBUSY。 


^a Scb 


图 11-10 描述 了 用 于 保护 某 个 数据 结构 的 互 斥 量 。 当 一 个 以 上 的 线程 需要 访问 动态 分 配 的 对 
象 时 ， 我 们 可 以 在 对 和 象 中 髓 入 引用 计数 ， 确 保 在 所 有 使 用 该 对 象 的 线程 完成 数据 访问 之 前 ， 该 对 
象 内 存 空间 不 会 被 释放 。 

在 对 引用 计数 加 1、 减 1、 检 查 引 用 计数 是 否 到 达 0 这 些 操 作 之 前 需要 锁 住 互 斥 量 。 在 
foo alloc 函数 中 将 引用 计数 初始 化 为 1 时 没 必 要 加 锁 ， 因 为 在 这 个 操作 之 前 分 配 线程 是 唯一 
引用 该 对 象 的 线程 。 但 是 在 这 之 后 如 果 要 将 该 对 象 放 到 一 个 列表 中 ， 那 么 它 就 有 可 能 被 别 的 线程 
发 现 ， 这 时 候 需 要 首先 对 它 加 锁 。 

在 使 用 该 对 象 前 , 线程 需要 调用 foo hola 对 这 个 对 象 的 引用 计数 加 1。 当 对 象 使 用 完毕 时 ， 
必须 调用 foo rele 释放 引用 。 最 后 一 个 引用 被 释放 时 ， 对 象 所 占 的 内 存 空 间 就 被 释放 。 

在 这 个 例子 中 , 我们 忽略 了 线程 在 调用 foo hola 之 前 是 如 何 找到 对 象 的 。 如 果 有 另 一 个 线 
程 在 调用 foo hold 时 阻塞 等 待 互 斥 锁 ， 这 时 即使 该 对 每 引用 计数 为 0，foo_rele 释放 该 对 象 
的 内 存 仍然 是 不 对 的 。 可 以 通过 确保 对 象 在 释放 内 存 前 不 会 被 找到 这 种 方式 来 避免 上 述 问 题 。 可 


gi 


以 通过 下 面 的 例子 来 看 看 如 何 做 到 这 一 点 。 u 


322 第 11 章 线程 








#include <stdlib.h> 
#include <pthread.h> 


struct foo { 


int f count; 
pthread mutex t f lock; 

int f id; 

/* ... more stuff here ... */ 


struct foo * 
foo alloc(int id) /* allocate the object */ 
( 

struct foo *fp; 


if ((fp = malloc(sizeof(struct foo))) !- NULL) { 
fp-»f count = 1; 
fp-»f id = id; 
if (pthread mutex init(&fp-»5f lock, NULL) != 0) { 
free(fp): 
return (NULL); 
} 
/* ... continue initialization ... */ 
} 
return (fp); 


void 
foo_hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread_mutex_lock (&fp->f_lock) ; 

fp->f_count++; 

pthread mutex unlock(&fp-»f lock); 


void 
foo rele(struct foo *fp) /* release a reference to the object */ 
i 
pthread mutex lock(&fp-»f lock); 
if (--fp-»5f count == 0) { /* last reference */ 
pthread mutex unlock(&fp-»f lock); 
pthread mutex destroy(&fp-»f lock); 
free {fp); 
} else { 
pthread_mutex_unlock (&fp->f_lock) ; 





11-10 使 用 互 斥 量 保 护 数据 结构 


11.6.2 ”避免 死 锁 


如 果 线 程 试 图 对 同一 个 互 斥 量 加 锁 两 次 , 那么 它 自身 就 会 陷入 死 锁 状态 , 但 是 使 用 互 斥 量 时 ， 
还 有 其 他 不 太 明 显 的 方式 也 能 产生 死 锁 。 例 如 ， 程 序 中 使 用 一 个 以 上 的 互 斥 量 时 ， 如 果 允 许 一 个 
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线程 一 直 占 有 第 一 个 互 斥 量 ， 并 且 在 试图 锁 住 第 二 个 互 斥 量 时 处 于 阻塞 状态 ， 但 是 拥有 第 二 个 互 
斥 量 的 线程 也 在 试图 锁 住 第 一 个 互 斥 量 。 因 为 两 个 线程 都 在 相互 请 求 另 一 个 线程 拥有 的 资源 ， 所 
以 这 两 个 线程 都 无 法 向 前 运行 ， 于 是 就 产生 死 锁 。 

可 以 通过 仔细 控制 互 斥 量 加 锁 的 顺序 来 避免 死 锁 的 发 生 。 例如, 假设 需要 对 两 个 互 斥 量 A 和 
B 同时 加 锁 。 如 果 所 有 线程 总 是 在 对 互 斥 量 B 加 锁 之 前 锁 住 互 斥 量 A， 那 么 使 用 这 两 个 互 斥 量 就 
不 会 产生 死 锁 (当然 在 其 他 的 资源 上 仍 可 能 出 现 死 锁 )。 类 似 地 ， 如 果 所 有 的 线程 总 是 在 锁 住 互 
斥 量 A 之 前 锁 住 互 斥 量 B， 那 么 也 不 会 发 生死 锁 。 可 能 出 现 的 死 锁 只 会 发 生 在 一 个 线程 试图 锁 住 
另 一 个 线程 以 相反 的 顺序 锁 住 的 互 斥 量 。 

有 时 候 ， 应 用 程序 的 结构 使 得 对 互 斥 量 进行 排序 是 很 困难 的 。 如 果 涉 及 了 太 多 的 锁 和 数据 结 
构 ， 可 用 的 函数 并 不 能 把 它 转 换 成 简单 的 层次 ， 那 么 就 需要 采用 另外 的 方法 。 在 这 种 情况 下 ， 可 以 
先 释放 占有 的 锁 ， 然 后 过 一 段 时 间 再 试 。 这 种 情况 可 以 使 用 pthreaqd_mutex_trylock 接口 避免 
死 锁 。 如 果 已 经 占有 某 些 锁 而 且 pthread mutex trylock 接口 返回 成 功 ， 那 么 就 可 以 前 进 。 但 
是 ， 如 果 不 能 获取 锁 ， 可 以 先 释 放 已 经 占有 的 锁 ， 做 好 清理 工作 ， 然 后 过 一 段 时 间 再 重新 试 。 


sm 实例 

在 这 个 例子 中 ， 我 们 更 新 了 图 11-10 的 程序 ， 展 示 了 两 个 互 斥 量 的 使 用 方法 。 在 同时 需要 两 个 
互 斥 量 时 ， 总 是 让 它们 以 相同 的 顺序 加 锁 ， 这 样 可 以 避免 死 锁 。 第 二 个 互 斥 量 维护 着 一 个 用 于 跟踪 
foo 数据 结构 的 散 列 列表 。 这 样 hashlock 互 斥 量 既 可 以 保护 foo 数据 结构 中 的 散 列表 fh, 又 可 


以 保护 散 列 链 字 段 f£ next. foo 结构 中 的 flock 互 斥 量 保护 对 foo 结构 中 的 其 他 字段 的 访问 。 


#include «stdlib.h» 
#include <pthread.h> 


#define NHASH 29 
#define HASH(id) (( (unsigned long) id) SNHASH) 


struct foo *fh[NHASH]; 
pthread mutex t hashlock - PTHREAD MUTEX INITIALIZER; 


struct foo í( 


int f count; 

pthread mutex t f lock; 

int f id; 

struct foo * f next; /* protected by hashlock */ 
/* ... more stuff here ... */ 


j; 


struct foo * 
foo alloc(int id) /* allocate the object */ 
{ 

struct foo *fp; 

int idx; 


if ((fp = mailoc (sizeof (struct foo))) != NULL) { 
fp->f_count = 1; 
fp->f_id = id; 
if (pthread_mutex_init (&fp->f_lock, NULL) != 0) ( 


401 
402 
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free(fp): 
return (NULL); 
} 
idx = HASH (id); 
pthread_mutex_lock (&hashlock) ; 
fp->f_next = fh[idx]; 
fh[idx] = fp; 
pthread_mutex_lock (&fp->f_lock) ; 
pthread mutex unlock(&hashlock); 
/* ... continue initialization ... */ 
pthread mutex unlock(&fp-»f lock): 
} 
return (fp); 


void 
foo_hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread_mutex_lock (&fp->f_lock) ; 

fp-»f count-*t; 

pthread mutex unlock(&fp-»f lock); 


struct foo * 
foo find(int id) /* find an existing object */ 


struct foo *fp; 


pthread mutex lock (&hashlock); 
for (fp = fh[HASH(id)]; fp != NULL; fp = fp-»f next) { 
if (fp-»f id == id) { 
foo hold(fp): 
break; 


) 
pthread mutex unlock(&hashlock); 


return(fp); 


void 
foo rele(struct foo *fp) /* release a reference to the object */ 
i 

struct foo *tfp; 

int idx; 


pthread mutex lock(&fp-»f lock): 
if (fp-»f count == 1) ( /* last reference */ 
pthread mutex unlock(&fp-»f lock); 
pthread mutex lock(&hashlock); 
pthread mutex lockí(&fp-»f lock); 
/* need to recheck the condition */ 
if (fp-»f count != 1) { 
fp-»5f count--; 
pthread mutex unlock(&fp-»f, lock); 
pthread mutex unlock(&hashlock); 
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return; 
] 
/* remove from list */ 
idx = HASH(fp-»f id); 
tfp = fh[idx]; 
if (tfp == fp) { 

fh[idx] = fp->f_next; 
} else { 

while (tfp-»f next !- fp) 

tfp - tfp-»f next; 

tfp-»f next = fp-»f next; 
} 
pthread mutex unlock(&hashlock); 
pthread mutex unlock(&fp-»f lock); 
pthread mutex destroy(&fp-»f lock); 
free(fp); 

} else { 

fp-»f count--; 
pthread mutex unlock(&fp-»f lock); 


1-0 使 用 两 个 互 斥 量 

比较 图 11-11 和 图 11-10， 可 以 看 出 ， 分 配 函 数 现在 锁 住 了 散 列 列表 锁 ， 把 新 的 结构 添加 到 了 
散 列 桶 中 ， 而 且 在 对 散 列 列表 的 锁 解 锁 之 前 ， 先 锁定 了 新 结构 中 的 互 斥 量 。 因 为 新 的 结构 是 放 在 全 
局 列表 中 的 ， 其 他 线程 可 以 找到 它 ， 所 以 在 初始 化 完成 之 前 ， 需 要 阻塞 其 他 线程 试图 访问 新 结构 。 

foo find 函数 锁 住 散 列 列表 锁 ， 然 后 搜索 被 请 求 的 结构 。 如 果 找 到 了 ， 就 增加 其 引用 计数 
并 返回 指向 该 结构 的 指针 。 注 意 ， 加 锁 的 顺序 是 ， 先 在 foo find 函数 中 锁定 散 列 列表 锁 ， 然 后 
再 在 £oo hold 函数 中 锁定 foo 结构 中 的 £ 1ock 互 斥 量 。 

现在 有 了 两 个 锁 以 后 ，foo_rele 函数 就 变 得 更 加 复杂 了 。 如 果 这 是 最 后 一 个 引用 ， 就 需要 对 
这 个 结构 互 斥 量 进行 解锁 , 因为 我 们 需要 从 散 列 列表 中 删除 这 个 结构 , 这 样 才 可 以 获取 散 列 列表 锁 ， 
然后 重新 获取 结构 互 斥 量 。 从 上 一 次 获得 结构 互 斥 量 以 来 我 们 可 能 被 阻塞 着 ， 所 以 需要 重新 检查 条 
件 ， 判 断 是 否 还 需要 释放 这 个 结构 。 如 果 另 一 个 线程 在 我 们 为 满足 锁 顺 序 而 阻塞 时 发 现 了 这 个 结构 
并 对 其 引用 计数 加 1， 那 么 只 需要 简单 地 对 整个 引用 计数 减 1， 对 所 有 的 东西 解锁 ， 然 后 返回 。 

这 种 锁 方 法 很 复杂 ， 所 以 我 们 需要 重新 审视 原来 的 设计 。 我 们 也 可 以 使 用 散 列 列表 锁 来 保护 
结构 引用 计数 , 使 事情 大 大 简化 。 结 构 互 斥 量 可 以 用 于 保护 foo 结构 中 的 其 他 任何 东西 .图 11-12 
反映 了 这 种 变化 。 


#include <stdlib.h> 
#include <pthread.h> 


#define NHASH 29 
#define HASH (id) (((unsigned long)id) *NHASH) 


struct foo *fh[NHASH]; 
pthread mutex t hashlock - PTHREAD MUTEX INITIALIZER; 


struct foo { 
int f count; /* protected by hashlock */ 
pthread mutex t f lock; 
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int f id; 
struct foo * f next; /* protected by hashlock */ 
/* ... more stuff here ... */ 


struct foo * 
foo alloc(int id) /* allocate the object */ 
{ 

struct foo *fp; 

int idx; 


if ((fp = malloc(sizeof(struct foo))) != NULL) { 
fp-»f count = 1; 
fp-»f id = id; 
if (pthread mutex init(&fp-»f lock, NULL) != 0) { 
free(fp); 
return (NULL) ; 
} 
idx = HASH (id); 
pthread_mutex_lock (&hashlock) ; 
fp-»f next = fh[idx]; 
fh[idx] = fp: 
pthread,mutex lock(&fp-»f lock); 
pthread mutex unlock(&hashlock); 
/* ... continue initialization ... */ 
pthread mutex unlock(&fp-»f lock); 
} 
return (fp); 


void 
foo_hold(struct foo *fp) /* add a reference to the object */ 
{ 

pthread mutex lock(&hashlock); 

fp->f_count+t; 

pthread_mutex_unlock (&hashlock}; 


struct foo * 
foo find(int id) /* find an existing object */ 


{ 
struct foo *fp; 


pthread mutex lock(&hashlock); 
for (fp = fh[HASH(id)]; fp != NULL; fp = fp-»f next) { 
if (fp->f_id == id) { 
fp->f_count++; 
break; 


} 
pthread mutex unlock(&hashlock); 


return(fp); 


void 
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foo rele(struct foo *fp) /* release a reference to the object */ 
{ 

struct foo *tfp; 

int idx; 


pthread mutex lock(&hashlock); 
if (--fp-»f count == 0) { /* last reference, remove from list */ 
idx = HASH(fp-»f id); 
tfp = fh[idx]: 
if (tfp == fp) { 
fh[idx] = fp->f_next; 
} else { 
while (tfp->f next != fp) 
tfp = tfip->f_next; 
tfp->f_next = fp-»f next; 
} 
pthread mutex unlock(&hashlock); 
pthread mutex destroy(&fp-»f lock); 
free(fp):; 
} else { 
pthread mutex unlock(&hashlock); 
] 


图 11-12 简化 的 锁 
注意 ， 与 图 11-11 中 的 程序 相 比 ， 图 11-12 中 的 程序 就 简单 多 了 。 两 种 用 途 使 用 相同 的 锁 时 ， 
围绕 散 列 列表 和 引用 计数 的 锁 的 排序 问题 就 不 存在 了 。 多 线程 的 软件 设计 涉及 这 两 者 之 间 的 折 
中 。 如 果 锁 的 粒度 太 粗 ， 就 会 出 现 很 多 线程 阻塞 等 待 相同 的 锁 ， 这 可 能 并 不 能 改善 并 发 性 。 如 果 
锁 的 粒度 太 细 ， 那 么 过 多 的 锁 开 销 会 使 系统 性 能 受到 影响 ， 而 且 代码 变 得 复杂 。 作为 一 个 程序 员 ， 
需要 在 满足 锁 需求 的 情况 下 ， 在 代码 复杂 性 和 性 能 之 间 找 到 正确 的 平衡 。 "n 


11.6.3 M% pthread_mutex_timedlock 


当 线 程 试图 获取 一 个 已 加 锁 的 互 斥 量 时 ，pthread mutex timedlock 互 斥 量 原 语 允许 绑 
定 线程 阻塞 时 间 。pthread_mutex_timedlock M$- pthread mutex lock 是 基本 等 价 的 ， 
但 是 在 达到 超时 时 间 值 时 ，pthread_mutex_timedlock 不 会 对 互 斥 量 进行 加 锁 ， 而 是 返回 错 
误 码 ETIMEDOUT。 


#include <pthread.h> 
#include <time.h> 


int pthread_mutex_timedlock(pthread_mutex_t *restrict mutex, 
const struct timespec *restrict !sptr); 


EE: BR, AO; 否则， 返回 错误 编号 





超时 指定 愿意 等 待 的 绝对 时 间 与 相对 时 间 对 比 而 言 ， 指 定 在 时 间 半 之 前 可 以 阻塞 等 待 ， 而 
不 是 说 愿意 阻塞 了 秒 )。 这 个 超时 时 间 是 用 timespec 结构 来 表示 的 , 它 用 秒 和 纳 秒 来 描述 时 间 。 


5 实例 
图 11-13 给 出 了 如 何 用 pthread mutex timedlock 避免 永久 阻塞 。 
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#include "apue.h" 
#include «pthread.h» 


int 
main(void) 
( 
int err; 
struct timespec tout; 
struct tm *tmp; 
char buf[64]; 
pthread mutex t lock = PTHREAD MUTEX, INITIALIZER; 


pthread mutex lock(&lock); 
printf ("mutex is locked\n"); 
clock_gettime (CLOCK_REALTIME, étout); 
tmp = localtime(&tout.tv sec); 
strftime(buf, sizeof(buf), "$r", tmp); 
printf("current time is %s\n", buf); 
tout.tv sec += 10; /* 10 seconds from now */ 
/* caution: this could lead to deadlock */ 
err = pthread mutex timedlock(&lock, &tout); 
Clock gettime(CLOCK REALTIME, &tout); 
tmp = localtime(&tout.tv, sec); 
strftime(buf, sizeof(buf), "tr", tmp); 
printf("the time is now %s\n", buf); 
if (err == 0) 

printf("mutex locked again!\n"); 
else 

printf ("can't lock mvtex again:%s\n",strerror({err)); 
exit(0); 


11-13 使 用 pthread mutex timedlock 


图 11-13 中 的 程序 运行 结果 输出 如 下 : 


$ ./a.out 

mutex is locked 

current time is 11:41:58 AM 

the time is now 11:42:08 AM 

can't lock mutex again: Connection timed out 


这 个 程序 故意 对 它 已 有 的 互 斥 量 进行 加 锁 ， 目 的 是 演示 pthread mutex timedlock 是 如 

何 工作 的 。 不 推荐 在 实际 中 使 用 这 种 策略 ， 因 为 它 会 导致 死 锁 。 
注意 ， 阻 塞 的 时 间 可 能 会 有 所 不 同 ， 造 成 不 同 的 原因 有 多 种 ， 开始 时 间 可 能 在 某 秒 的 中 间 位 
置 ， 系 统 时 钟 的 精度 可 能 不 足以 精确 到 支持 我 们 指定 的 超时 时 间 值 ， 或 者 在 程序 继续 运行 前 ， 调 
度 延 迟 可 能 会 增加 时 间 值 。 a” 
| —— Mac OS X 10.6.8 还 没有 支持 pthread mutex timedlock, 但 是 FreeBSD 8.0, Linux 3.2.0 
| 以 及 Solaris 10 支持 该 函 教 ， 虽 然 Solaris 仍然 把 它 放 在 实时 库 1ibrt Po Solaris 10 还 提供 了 另 一 

| 个 使 用 相对 超时 时 间 的 函数 。 


11.6.4 5H 
读 写 锁 (reader-writer lock) 与 互 斥 量 类 似 ， 不 过 读 写 锁 人 允许 更 高 的 并 行 性 。 互 斥 量 要 人 么 是 锁 
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住 状态 ， 要 么 就 是 不 加 锁 状 态 ， 而 且 一 次 只 有 一 个 线程 可 以 对 其 加 锁 。 读 写 锁 可 以 有 3 种 状态 : 
读 模式 下 加 锁 状 态 ， 写 模式 下 加 锁 状 态 ， 不 加 锁 状 态 。 一 次 只 有 一 个 线程 可 以 占有 写 模式 的 读 写 
锁 ， 但 是 多 个 线程 可 以 同时 占有 读 模式 的 读 写 锁 。 

当 读 写 锁 是 写 加 锁 状态 时 , 在 这 个 锁 被 解锁 之 前 , 所 有 试图 对 这 个 锁 加 锁 的 线程 都 会 被 阻塞 。 
当 读 写 锁 在 读 加 锁 状 态 时 ， 所 有 试图 以 读 模式 对 它 进行 加 锁 的 线程 都 可 以 得 到 访问 权 ， 但 是 任何 
希望 以 写 模式 对 此 锁 进 行 加 锁 的 线程 都 会 阻塞 ， 直 到 所 有 的 线程 释放 它们 的 读 锁 为 止 。 虽 然 各 操 
作 系 统 对 读 写 锁 的 实现 各 不 相同 ， 但 当 读 写 锁 处 于 读 模式 锁 住 的 状态 ， 而 这 时 有 一 个 线程 试图 以 
写 模 式 获取 锁 时 ， 读 写 锁 通常 会 阻塞 随后 的 读 模 式 锁 请 求 。 这 样 可 以 避免 读 模式 锁 长 期 占用 ， 而 
等 待 的 写 模式 锁 请 求 一 直 得 不 到 满足 。 

读 写 锁 非 常 适合 于 对 数据 结构 读 的 次 数 远 大 于 写 的 情况 。 当 读 写 锁 在 写 模式 下 时 ， 它 所 保护 的 数据 
结构 就 可 以 被 安全 地 修改 ， 因 为 一 次 只 有 一 个 线程 可 以 在 写 模式 下 拥有 这 个 锁 。 当 读 写 锁 在 读 模式 下 时 ， 
只 要 线程 先 获取 了 读 模 式 下 的 读 写 锁 ， 该 锁 所 保护 的 数据 结构 就 可 以 被 多 个 获得 读 模 式 锁 的 线程 读 取 。 

读 写 锁 也 叫做 共享 互 斥 锁 Cshared-exclusive lock)。 当 读 写 锁 是 读 模式 锁 住 时 ， 就 可 以 说 成 是 
以 共享 模式 锁 住 的 。 当 它 是 写 模式 锁 住 的 时 候 ， 就 可 以 说 成 是 以 互 斥 模式 锁 住 的 。 

与 互 斥 量 相 比 ， 读 写 锁 在 使 用 之 前 必须 初始 化 ， 在 释放 它们 底层 的 内 存 之 前 必须 销毁 。 


#include «pthread.h» 


int pthread rwlock init(pthread rwlock t *restrict rwlock, 
const pthread rwlockattr t *restrict attr); 


int pthread rwlock destroy(pthread rwlock t *rwlock); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 





读 写 锁 通 过 调用 pthread rwlock init 进行 初始 化 。 如 果 希 望 读 写 锁 有 默认 的 属性 ， 可 
以 传 一 个 null 指针 给 artrr， 我 们 将 在 12.4.2 节 中 讨论 读 写 锁 的 属性 。 

Single UNIX Specification 在 XSI 扩展 中 定义 了 PTHREAD RWLOCK INITIALIZER 常量 。 如 
果 默 认 属 性 就 足够 的 话 ， 可 以 用 它 对 静态 分 配 的 读 写 锁 进 行 初始 化 。 

在 释放 读 写 锁 占用 的 内 存 之 前 ， 需 要 调用 pthread rwlock destroy 做 清理 工作 。 如 果 
pthread rwlock init 为 读 写 锁 分 配 了 资源 ，pthread_rwlock_destroy 将 释放 这 些 资源 。 
如 果 在 调用 pthread rwlock destroy 之 前 就 释放 了 读 写 锁 占用 的 内 存 空间 ， 那 么 分 配给 这 
个 锁 的 资源 就 会 丢失 。 

要 在 读 模式 下 锁定 读 写 锁 ， 需 要 调用 pthread_rwlock_rdlock。 要 在 写 模式 下 锁定 读 写 锁 ， 
需要 调用 pthread_rwlock_wrlock。 不 管 以 何 种 方式 锁 住 读 写 锁 ， 都 可 以 调用 pthread_rwlock_ 
unlock 进行 解锁 。 

#include «pthread.h» 
int pthread rwlock rdlock(pthread rwlock t *rwlock); 


int pthread rwlock wrlock(pthread rwlock t *rwlock); 


int pthread rwlock unlock(pthread rwlock t *rwlock); 


所 有 函数 的 返回 值 : BRK, REO; 否则 ， 返 回 错误 编号 





各 种 实现 可 能 会 对 共享 模式 下 可 获取 的 读 写 锁 的 次 数 进行 限制 ， 所 以 需要 检查 pthread_ 
rwlock rdlock 的 返回 值 ,即使 pthread rwlock wrlock Ml pthread_rwlock_unlock 有 错误 
返回 , 而且 从 技术 上 来 讲 ， 在 调用 函数 时 应 该 总 是 检查 错误 返回 , 但 是 如 果 锁 设计 合理 的 话 ， 就 不 需要 
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检查 它们 。 错 误 返 回 值 的 定义 只 是 针对 不 正确 使 用 读 写 锁 的 情况 〈 如 未 经 初始 化 的 锁 )， 或 者 试图 获取 
已 拥有 的 锁 从 而 可 能 产生 死 锁 的 情况 。 但 是 需要 注意 ， 有 些 特 定 的 实现 可 能 会 定义 另外 的 错误 返回 。 
Single UNIX Specification 还 定义 了 读 写 锁 原 语 的 条 件 版 本 。 


#include <pthread.h> 


int pthread rwlock tryrdlock(pthread rwlock t *rwiock); 


int pthread rwlock trywrlock(pthread rwlock t *rwlock) ; 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错 误 编 号 





可 以 获取 锁 时 ， 这 两 个 函数 返回 0。 否则 ， 它 们 返回 错误 EBUSY。 这 两 个 函数 可 以 用 于 我 们 
前 面 讨论 的 遵守 某 种 锁 层 次 但 还 不 能 完全 避免 死 锁 的 情况 。 


PES 


图 11-14 中 的 程序 解释 了 读 写 锁 的 使 用 。 作 业 请 求 队列 由 单个 读 写 锁 保 护 。 这 个 例子 给 出 了 
11-1 所 示 的 一 种 可 能 的 实现 ， 多 个 工作 线程 获取 单个 主线 程 分 配给 它们 的 作业 ，。 


#include <stdlib.h> 
#include <pthread.h> 


struct job 1 
struct job *j next; 
struct job *j prev; 
pthread t j_id; /* tells which thread handles this job */ 
/* ... more stuff here ... */ 


); 


struct queue { 
struct job *q head; 
struct job *q tail; 
pthread rwlock t q lock; 
}; 


/* 
* Initialize a queue. 
*/ 
int 
queue init(struct queue *qp) 
{ 
int err; 


qp->q_head = NULL; 
qp->q_tail = NULL; 
err = pthread_rwlock_init (&qp->q_lock, NULL); 
if {err != 0} 

return {err}; 
/* ... continue initialization ... */ 
return(0); 


) 


/* 
* Insert a job at the head of the queue. 
*/ 
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void 
job_insert (struct queue *qp, struct job *jp) 
{ 
pthread_rwlock_wrlock (&qp->q_lock); 
jp->j_next = qp-»q head; 
jp->j_prev = NULL; 
if (qp-»q head != NULL} 
qp-»q head-»5j prev = jp; 
else 
qp->q_tail = jp; /* list was empty */ 
qp->q_head = jp; 
pthread_rwlock_unlock (&qp->q_lock) ; 


/* 
* Append a job on the tail of the queue. 
*/ 
void 
job append(struct queue *qp, struct job *jp) 
{ 
pthread rwlock wrlock(&qp-»q lock); 
jP-^j next = NULL; 
jp->j_prev = dqp-?q tail; 
if (qp-»q tail != NULL) 
qp-^q tail-»j next = jp; 
else 
qp-»q head = jp; /* list was empty */ 
qp-»q tail = jp: 
pthread rwlock unlock(&qp-»q lock); 


/* 
* Remove the given job from a queue. 
*y 
void 
job remove(struct queue *qp, struct job *jp) 
{ 
pthread rwlock wrlock(&qp-»q lock); 
if (jp == qp->q head) { 
qp-»q head = jp-»j next; 
if (qp-»q tail == jp) 
qp-»q tail = NULL; 
else 
jp-^j next-»j prev = jp-»5j prev; 
} else if (ip == qp-»qa tail) 1 
qp-»q tail = jp-»j prev; 
jp-»j prev-»j next = jp-»j next; 
} else { 
jp->j_prev->j_next = jp->j_next; 
jp->j_next->j_prev jp->j_prev: 


} 
pthread rwlock unlock (&qp->q_lock) ; 


/* 
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* Find a job for the given thread ID. 
< 
struct job * 
job find(struct queue *gp, pthread t id) 
{ 

struct job *jp; 


if (pthread rwlock rdlock(&qp-»q lock) != O0) 
return (NULL); 


for (jp = qp->q_ head; jp != NULL; jp = jp-»j next) 
if (pthread equal(jp-»j id, id)) 
break; 


pthread rwlock unlockí(&qp-»q lock); 
return(jp): 


图 11-14 HESH 
在 这 个 例子 中 ， 凡 是 需要 向 队列 中 增加 作业 或 者 从 队列 中 删除 作业 的 时 候 ， 都 采用 了 写 模式 来 锁 
住 队列 的 读 写 锁 。 不 管 何 时 搜索 队列 , 都 需要 获取 读 模式 下 的 锁 , 允许 所 有 的 工作 线程 并 发 地 搜索 队列 。 
在 这 种 情况 下 ， 只 有 在 线程 搜索 作业 的 频率 远 远 高 于 增加 或 删除 作业 时 ， 使 用 读 写 锁 才 可 能 改善 性 能 。 
工作 线程 只 能 从 队列 中 读 取 与 它们 的 线程 ID 匹配 的 作业 。 由 于 作业 结构 同一 时 间 只 能 由 一 
个 线程 使 用 ， 所 以 不 需要 额外 的 加 锁 。 a 


11.6.5. ARTZ Bi 


5 HER, Single UNIX Specification 提供 了 带 有 超时 的 读 写 锁 加 锁 函 数 ， 使 应 用 程序 在 获取 
读 写 锁 时 避免 陷入 永久 阻塞 状态 。 这 两 个 函数 是 pthread rwlock timedrdlock 和 pthread_ 


rwlock timedwrlock. 


#include «pthread.h» 
#include <time.h> 


int pthread_rwlock_timedrdlock (pthread rwlock t *restrict rwlock, 
const struct timespec *restrict (ísptr); 


int pthread rwlock timedwrlock(pthread rwlock t *restrict rwlock, 
const struct timespec *restrict (ísptr); 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 





这 两 个 函数 的 行为 与 它们 “不 计时 的 ”版 本 类 似 。tsptr 参数 指 同 timespec 结构 ， 指 定 线程 
应 该 停止 阻塞 的 时 间 。 如 果 它 们 不 能 获取 锁 ， 那 么 超时 到 期 时 ， 这 两 个 函数 将 返回 ETIMEDOUT 
错误 。 与 pthread_mutex_timedlock 函数 类 似 ， 超 时 指定 的 是 绝对 时 间 ， 而 不 是 相对 时 间 。 


11.6.6 ”条 件 变 量 


条 件 变量 是 线程 可 用 的 另 一 种 同步 机 制 。 条 件 变量 给 多 个 线程 提供 了 一 个 会 合 的 场所 。 条 件 
变量 与 互 斥 量 一 起 使 用 时 ， 人 允许 线程 以 无 竞争 的 方式 等 待 特定 的 条 件 发 生 。 
条 件 本 身 是 由 互 斥 量 保护 的 。 线 程 在 改变 条 件 状态 之 前 必须 首先 锁 住 互 斥 量 。 其 他 线程 在 获 
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得 互 斤 量 之 前 不 会 察觉 到 这 种 改变 ， 因 为 互 斥 量 必须 在 锁定 以 后 才能 计算 条 件 。 

在 使 用 条 件 变量 之 前 ， 必 须 先 对 它 进行 初始 化 。 由 Pthread_cond t 数据 类 型 表示 的 条 件 变量 
可 以 用 两 种 方式 进行 初始 化 , 可 以 把 常量 PTHREAD_COND_INITIALIZER 赋 给 静态 分 配 的 条 件 变量 ， 
但 是 如 果 条 件 变 量 是 动态 分 配 的 ， 则 需要 使 用 pthread_cond_init 函数 对 它 进行 初始 化 。 

在 释放 条 件 变 量 底层 的 内 存 空间 之 前 , 可 以 使 用 pthread_cond_destroy 函数 对 条 件 变量 
进行 反 初始 化 〈deinitialize )。 


#include «pthread.h» 


int pthread cond init(pthread cond t *restrict cond, 
const pthread condattr t *restrict afir}; 


int pthread cond destroy(pthread cond t *cond); 
两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错 误 编 号 
除非 需要 创建 一 个 具有 非 默 认 属 性 的 条 件 变 量 , 否则 pthread_cond_init 函数 的 anr 参数 
可 以 设置 为 NULL。 我 们 将 在 12.4.3 节 中 讨论 条 件 变 量 属 性 。 
我 们 使 用 pthread_cond_wait 等 待 条 件 变 量变 为 真 。 如 果 在 给 定 的 时 间 内 条 件 不 能 满足 ， 
那么 会 生成 一 个 返回 错误 码 的 变量 。 


#include <pthread.h> 





int pthread_cond_wait (pthread_cond_t *restrict cond, 
pthread mutex t *restrict mutex); 


int pthread_cond_timedwait (pthread_cond_t *restrict cond, 
pthread_mutex_t *restrict mutex, 
const struct timespec *restrict ¢spir); 


两 个 函数 的 返回 值 : A, EO: 否则， 返回 错误 编号 





传递 给 pthread cond wait 的 互 斥 量 对 条 件 进 行 保护 。 调 用 者 把 锁 住 的 互 斥 量 传 给 函数 ， 
函数 然后 自动 把 调用 线程 放 到 等 竺 条件 的 线程 列表 上 ， 对 互 斥 量 解锁 。 这 就 关闭 了 条 件 检查 和 线 
程 进入 休 眼 状态 等 待 条 件 改 变 这 两 个 操作 之 间 的 时 间 通 道 ， 这 样 线程 就 不 会 错过 条 件 的 任何 变 
1L. pthread cond wait 返回 时 ， 互 斥 量 再 次 被 锁 住 。 

pthread cond timedwait 函数 的 功能 与 pthread_cond wait 函数 相似 ， 只 是 多 了 一 
个 超时 (tsptr)。 超 时 值 指 定 了 我 们 愿意 等 待 多 长 时 间 ， 它 是 通过 timespec 结构 指定 的 。 

如 图 11-13 所 示 ， 需 要 指定 愿意 等 待 多 长 时 间 ， 这 个 时 间 值 是 一 个 绝对 数 而 不 是 相对 数 。 例 
如 ,假设 愿意 等 待 3 分 钟 。 那 么 ， 并 不 是 把 3 分 钟 转换 成 timespec 结构 ， 而 是 需要 把 当前 时 间 
加 上 3 分 钟 再 转换 成 timespec 结构 。 

可 以 使 用 clock gettime 函数 CJ 6.10 节 ) 获取 timespec 结构 表示 的 当前 时 间 。 但 是 
目前 并 不 是 所 有 的 平台 都 支持 这 个 函数 ， 因 此 ， 也 可 以 用 另 一 个 函数 gettimeofday 获取 
timeval 结构 表示 的 当前 时 间 ， 然 后 把 这 个 时 间 转 换 成 timespec 结构 。 要 得 到 超时 值 的 绝对 
时 间 ， 可 以 使 用 下 面 的 函数 〈 假 设 阻塞 的 最 大 时 间 使 用 分 来 表示 的 ): 


#include <sys/time.h> 
#include <stdlib.h> 


void 
maketimeout (struct timespec *tsp, long minutes) 
{ 
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struct timeval now; 


/* get the current time */ 

gettimeofday(&now, NULL); 

tsp-»2tv sec = now.tv sec; 

tsp-»tv nsec - now.tv usec * 1000; /* usec to nsec */ 
/* add the offset to get timeout value */ 

tsp-»tv sec += minutes * 60; 


} 

如 果 超 时 到 期 时 条 件 还 是 没有 出 现 ，pPthread_cond timewait 将 重新 获取 互 斥 量 ， 然 后 
返回 错误 ETIMEDOUT. M pthread cond wait 或 者 pthread cond timedwait 调用 成 功 
返回 时 ， 线 程 需要 重新 计算 条 件 ， 因 为 男 一 个 线程 可 能 已 经 在 运行 并 改变 了 条 件 。 

有 两 个 函数 可 以 用 于 通知 线程 条 件 已 经 满足 ,pthread_cond_signal 函数 至 少 能 唤醒 一 个 
等 待 该 条 件 的 线程 ， 而 pthread_cond_broadcast 函数 则 能 唤醒 等 待 该 条 件 的 所 有 线程 。 


| POSIX 规范 为 了 简化 pthread cond signal 的 实现 ， 允 许 它 在 实现 的 时 候 唤 醒 一 个 以 上 
| 的 线程 。 


#include <pthread.h> 


int pthread cond signal(pthread cond t *cond); 


int pthread, cond broadcast (pthread cond t *cond); 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0: 和 否则， 返回 错误 编号 





在 调用 pthread cond signal 或 者 pthread cond broadcast 时 , 我 们 说 这 是 在 给 线 
程 或 者 条 件 发 信号 。 必 须 注 意 ， 一 定 要 在 改变 条 件 状态 以 后 再 给 线程 发 信和 号。 


^ 实例 


图 11-15 给 出 了 如 何 结合 使 用 条 件 变量 和 互 斥 量 对 线程 进行 同步 。 


#include <pthread.h> 
struct msg { 
struct msg *m next; 


/* ... more stuff here ... */ 


}; 
struct msg *workq; 


pthread cond t qready - PTHREAD COND INITIALIZER; 


pthread mutex t qlock PTHREAD MUTEX INITIALIZER; 
void 
process msg(void) 
{ 
struct msg *mp; 


for (77) { 
pthread mutex lock(&qlock); 
while (workq == NULL) 
pthread cond wait(&qready, &qlock); 
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mp = workq; 

workq = mp-»m next; 
pthread_mutex_unlock (&qlock) ; 

/* now process the message mp */ 


} 


void 

enqueve_msq(struct msg *mp) 

{ 
pthread_mutex_lock (&qlock); 
mp-»m next = workq; 
workq - mp; 
pthread mutex unlock(&qlock); 
pthread cond signal(&qready); 


图 11-15 使 用 条 件 变量 


条 件 是 工作 队列 的 状态 。 我 们 用 互 斥 量 保护 条 件 ， 在 while 循环 中 判断 条 件 。 把 消息 放 到 
工作 队列 时 ， 需 要 占有 互 斥 量 ， 但 在 给 等 待 线程 发 信号 时 ， 不 需要 占有 互 斥 量 。 只 要 线程 在 调用 
pthread cond signal 之 前 把 消息 从 队列 中 拖 出 了 ， 就 可 以 在 释放 互 斥 量 以 后 完成 这 部 分 工作 。 
因为 我 们 是 在 while 循环 中 检查 条 件 ， 所 以 不 存在 这 样 的 问题 : 线程 醒 来 ， 发 现 队 列 仍 为 空 ， 然 
后 返回 继续 等 待 。 如 果 代 码 不 能 容忍 这 种 竞争 ， 就 需要 在 给 线程 发 信号 的 时 候 占 有 互 斥 量 。 a 


11.6.7 Abepi 


自 旋 锁 与 互 斥 量 类 似 ， 但 它 不 是 通过 休眠 使 进程 阻塞 ， 而 是 在 获取 锁 之 前 一 直 处 于 忙 等 〈 自 
AE) 阻塞 状态 。 自 旋 锁 可 用 于 以 下 情况 : 锁 被 持 有 的 时 间 短 ， 而 且 线程 并 不 希望 在 重新 调度 上 花 
费 太 多 的 成 本 。 

自 旋 锁 通 常 作为 底层 原 语 用 于 实现 其 他 类 型 的 锁 。 根 据 它 们 所 基于 的 系统 体系 结构 ， 可 以 通 
过 使 用 测试 并 设置 指令 有 效 地 实现 。 当 然 这 里 说 的 有 效 也 还 是 会 导致 CPU 资源 的 浪费 : 当 线 程 自 
旋 等 待 锁 变 为 可 用 时 ，CPU 不 能 做 其 他 的 事情 。 这 也 是 自 旋 锁 只 能 够 被 持 有 一 小 段 时 间 的 原因 。 

当 自 旋 锁 用 在 非 抢占 式 内 核 中 时 是 非常 有 用 的 ， 除了 提供 互 斥 机 制 以 外 ， 它 们 会 阻塞 中 断 ， 
这 样 中 断 处 理 程序 就 不 会 让 系统 陷入 死 锁 状 态 ， 因 为 它 需 要 获取 已 被 加 锁 的 自 旋 锁 〈 把 中 断想 成 
是 另 一 种 抢占 )。 在 这 种 类 型 的 内 核 中 ， 中 断 处 理 程序 不 能 休 眼 ， 因 此 它们 能 用 的 同步 原 语 只 能 
是 自 旋 锁 。 

但 是 ， 在 用 户 层 ， 自 旋 锁 并 不 是 非常 有 用 ， 除 非 运行 在 不 允许 抢占 的 实时 调度 类 中 。 运 行 在 
分 时 调度 类 中 的 用 户 层 线程 在 两 种 情况 下 可 以 被 取消 调度 : 当 它 们 的 时 间 片 到 期 时 ， 或 者 具有 更 
高 调度 优先 级 的 线程 就 绪 变 成 可 运行 时 。 在 这 些 情 况 下 ， 如 果 线 程 拥 有 自 旋 锁 ， 它 就 会 进入 休眠 
状态 ， 阻 塞 在 锁 上 的 其 他 线程 自 旋 的 时 间 可 能 会 比 预期 的 时 间 更 长 。 

很 多 互 斥 量 的 实现 非常 高 效 ， 以 至 于 应 用 程序 采用 互 斥 锁 的 性 能 与 曾经 采用 过 自 旋 锁 的 性 能 
基本 是 相同 的 。 事 实 上 ， 有 些 互 斥 量 的 实现 在 试图 获取 互 斥 量 的 时 候 会 自 旋 一 小 段 时 间 ， 只 有 在 
自 旋 计 数 到 达 某 一 赋值 的 时 候 才 会 休眠 。 这 些 因素 ， 加 上 现代 处 理 器 的 进步 ， 使 得 上 下 文 切换 越 
来 越 快 ， 也 使 得 自 旋 锁 只 在 某 些 特定 的 情况 下 有 用 。 

自 旋 锁 的 接口 与 互 斥 量 的 接口 类 似 ， 这 使 得 它 可 以 比较 容易 地 从 一 个 替换 为 另 一 个 。 可 以 用 
pthread spin init 函数 对 自 旋 锁 进 行 初始 化 。 用 pthread spin destroy MUHIT A WE 
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锁 的 反 初 始 化 。 


#include <pthread.h> 


int pthread spin init(pthread spinlock t *lock, int pshared) ; 


int pthread spin destroy(pthread spinlock t */ock); 
两 个 函数 的 返回 值 : 车 成 功 ， 返 回 0， 和 否则， 返回 错误 编号 





只 有 一 个 属性 是 自 旋 锁 特有 的 ， 这 个 属性 只 在 支持 线程 进程 共享 同步 (Thread Process-Shared 
Synchronization) 选项 (这 个 选项 目前 在 Single UNIX Specification 中 是 强制 的 ， 见 图 2-5) 的 平台 
上 才 用 得 到 。jpshared 参数 表示 进程 共享 属性 ， 表 明 自 旋 锁 是 如 何 获取 的 。 如 果 它 设 为 PTHREAD_ 
PROCESS_SHARED， 则 自 旋 锁 能 被 可 以 访问 锁 底 层 内 存 的 线程 所 获取 ， 即 便 那 些 线程 属于 不 同 的 
进程 ， 情 况 也 是 如 此 。 否 则 pshared 参数 设 为 PTHREAD_PROCESS_PRIVATE， 自 旋 锁 就 只 能 被 

初始 化 该 锁 的 进程 内 部 的 线程 所 访问 。 

可 以 用 pthread_spin_lock BR pthread_spin_trylock 对 自 旋 锁 进 行 加 锁 , 前 者 在 获取 锁 
之 前 一 直 自 旋 ， 后 者 如 果 不 能 获取 锁 ， 就 立即 返回 EBUSY 错误 。 注 意 ，Pthread_spin_ trylock 
不 能 自 旋 。 不 管 以 何 种 方式 加 锁 ， 自 旋 锁 都 可 以 调用 pthread spin unlock 函数 解锁 。 

#include <pthread.h> 
int pthread spin lock(pthread spinlock t *lock) ; 


int pthread spin trylock(pthread spinlock t *lock); 


int pthread spin unlock(pthread spinlock t *lock); 


所 有 函数 的 返回 值 ， 车 成功， 返回 EU, BERRA S 





注意 ， 如 果 自 旋 锁 当前 在 解锁 状态 的 话 ，pthread_spin_lock 函数 不 要 自 旋 就 可 以 对 它 加 
锁 。 如果 线程 已 经 对 它 加 锁 了 , 结果 就 是 未 定义 的 。 调 用 pthread_spin_lock 会 返回 EDEADLK 
错误 (或 其 他 错误 )， 或 者 调用 可 能 会 永久 自 旋 。 具 体 行为 依赖 于 实际 的 实现 。 试 图 对 没有 加 锁 
的 自 旋 锁 进行 解锁 ， 结 果 也 是 未 定义 的 。 

不 管 是 pthread_spin_lock 还 是 pthread spin trylock， 返 回 值 为 0 的 话 就 表示 自 
旋 锁 被 加 锁 。 需 要 注意 ， 不 要 调用 在 持 有 自 旋 锁 情 况 下 可 能 会 进入 休眠 状态 的 函数 。 如 果 亩 用 了 
这 些 函数 ， 会 浪费 CPU 资源 ， 因 为 其 他 线程 需要 获取 自 旋 锁 需 要 等 待 的 时 间 就 延长 了 。 


11.6.8 ”屏障 


屏障 (barrier) 是 用 户 协调 多 个 线程 并 行 工作 的 同步 机 制 。 屏 障 允 许 每 个 线程 等 待 ， 直 到 所 
有 的 合作 线程 都 到 达 某 一 点 ,然后 从 该 点 继续 执行 。 我 们 已 经 看 到 一 种 屏障 ，pthread_join 函 
数 就 是 一 种 屏障 ， 人 允许 一 个 线程 等 待 ， 直 到 另 一 个 线程 退出 。 

但 是 屏障 对 象 的 概念 更 广 ， 它 们 允许 任意 数量 的 线程 等 待 ， 直 到 所 有 的 线程 完成 处 理工 作 ， 
而 线程 不 需要 退出 。 所 有 线程 达到 屏障 后 可 以 接着 工作 。 

可 以 使 用 pthread barrier init 函数 对 屏障 进行 初始 化 ， 用 thread barrier destroy 
函数 反 初始 化 。 


#include <pthread.h> 


int pthread_barrier_init (pthread_barrier_t *restrict barrier, 


const pthread barrierattr t *restrict altr, 
unsigned int count); 





11.6 ”线程 同步 ”337 


int pthread barrier destroy(pthread barrier t *barrier); 





两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0， 和 否则， 返回 错误 编号 


初始 化 屏障 时 ， 可 以 使 用 count 参数 指定 ， 在 允许 所 有 线程 继续 运行 之 前 ， 必 须 到 达 屏 障 的 
线程 数目 。 使 用 attr 参数 指定 屏障 对 象 的 属性 , 我 们 会 在 下 一 章 详 细 讨 论 。 现 在 设置 attr 为 NULL; 
用 默认 属性 初始 化 屏障 。 如 果 使 用 pthread_barrier_init 函数 为 屏障 分 配 资源 ,那么 在 反 初 
始 化 屏障 时 可 以 调用 Pthread_barrier_destroy 函数 释放 相应 的 资源 。 

可 以 使 用 pthread_barrier_wait 函数 来 表明 , 线程 已 完成 工作 , 准备 等 所 有 其 他 线程 赴 上 来 。 


#include <pthread.h> 


int pthread barrier wait(pthread barrier t barrier) ; 


返回 值 ， 车 成 功 ， 返 回 0 或 者 PTHREAD BARRIER SERIAL THREAD; 否则 ， 返 回 错误 编号 





调用 pthread barrier wait 的 线程 在 屏障 计数 《调用 pthread barrier init 时 设 
SEO 未 满足 条 件 时 , 会 进入 休眠 状态 。 如 果 该 线程 是 最 后 一 个 调用 pthread_barrier wait 的 
线程 ， 就 满足 了 屏障 计数 ， 所 有 的 线程 都 被 唤醒 。 

对 于 一 个 任意 线程 ，pthread barrier wait 函数 返回 了 PTHREAD BARRIER SERIAL. 
THRERAD。 剩 下 的 线程 看 到 的 返回 值 是 0。 这 使 得 一 个 线程 可 以 作为 主线 程 ， 它 可 以 工作 在 其 他 所 
有 线程 已 完成 的 工作 结果 上 。 

一 旦 达到 屏障 计数 值 ， 而 且 线 程 处 于 非 阻 塞 状 态 ， 屏 障 就 可 以 被 重用 。 但 是 除非 在 调用 了 
pthread barrier destroy 函数 之 后 , 又 调用 了 了 pthread barrier init 函数 对 计数 用 另 
外 的 数 进行 初始 化 ， 否 则 屏障 计数 不 会 改变 。 


PE, 
图 11-16 给 出 了 在 一 个 任务 上 合作 的 多 个 线程 之 间 如 何 用 屏障 进行 同步 。 


#include "apue.h" 
#include «pthread.h» 
#include <limits.h> 
#include <sys/time.h> 


#define NTHR 8 /* number of threads */ 
#define NUMNUM 8000000L /* number of numbers to sort */ 
#define TNUM (NUMNUM/NTHR) /* number to sort per thread */ 


long nums (NUMNUM] ; 
long snums [NUMNUM] ; 


pthread barrier t b; 


#ifdef SOLARIS 
$define heapsort qsort 


felse 

extern int heapsort(void *, size_t, size_t, 
int (*) (const void *, const void *)); 

#fendif 

/* 


* Compare two long integers (helper function for heapsort) 
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*/ 
int 
complong(const void *argl, const void *arg2) 


{ 


long 11 = *(long *)argl; 
long 12 = *(long *)arg2; 
if (11 == 12) 

return 0; 


else if (11 < 12} 
return -1; 
else 
return 1; 


/* 
* Worker thread to sort a portion of the set of numbers, 
Ay 
void * 
thr fn(void *arg) 
{ 
long idx = (long)arg; 


heapsort(&nums[idx], TNUM, sizeof(long), complong); 
pthread barrier wait(&b); 


/* 

* Go off and perform more work ... 
*/ 

return((void *)0); 


/* 
* Merge the results of the individual sorted ranges. 
*/ 


void 
merge () 
{ 
long idx [NTHR]: 
long i, minidx, sidx, num; 


for (i = 0; i < NTHR; i++) 
idx[i] = i * TNUM; 
for (sidx = 0; sidx < NUMNUM; sidx**) { 
num = LONG MAX; 
for (i = 0; i < NTHR; i++) 1 
if ((idx[i] < (i+1)*TNUM) && (nums[idx[i]] < num)) 
num = nums[idx[ill: 
minidx = i; 


} 
snums{sidx] = nums[idx[minidxl]l: 
idx [minidx]++; 


{ 
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int 
main(í) 
( 
unsigned long i; 
struct timeval Start, end; 
long long startusec, endusec; 
double elapsed; 
int err; 
pthread_t tid; 
/* 
* Create the initial set of numbers to sort. 
*/ 


srandomí1); 
for (i = 0; i < NUMNUM; i++) 


nums[i] = random(); 
/* 
* Create 8 threads to sort the numbers. 
*/ 


gettimeofday(&start, NULL); 
pthread barrier init(&b, NULL, NTHR+1); 
for (i = 0; i < NTHR; i++) { 
err = pthread create(&tid, NULL, thr fn, (void *) (i * TNUM)):; 
if (err != Q) 
err exit(err, "can't create thread"); 
) 
pthread barrier, wait(&b); 
merge(t); 
gettimeofday(&end, NULL); 


/* 

* Print the sorted list. 

wy 

startusec = start.tv sec * 1000000 + start.tv usec; 
endusec = end.tv sec * 1000000 + end.tv usec; 
elapsed = (double) (endusec - startusec) / 1000000.0; 
printf("sort took $.4f seconds\n", elapsed); 

for (i = 0; i < NUMNUM; i++) 

printf("$1dMn", snums[i]); 
exit (0); 


11-16 使 用 屏障 

这 个 例子 给 出 了 多 个 线程 只 执行 一 个 任务 时 ， 使 用 屏障 的 简单 情况 。 在 更 加 实际 的 情况 下 ， 
工作 线程 在 调用 pthread barrier wait 函数 返回 后 会 接着 执行 其 他 的 活动 。 

在 这 个 实例 中 ， 使 用 8 个 线程 分 解 了 800 万 个 数 的 排序 工作 。 每 个 线程 用 堆 排序 算法 对 100 
万 个 数 进行 排序 (详细 算法 请 参阅 Knuth[1998])。 然后 主线 程 调 用 一 个 函数 对 这 些 结果 进行 合并 。 

并 不 需要 使 用 pthread barrier wait 函数 中 的 返回 值 PTHREAD BARRIER SERIAL. 
THREAD 来 决定 哪个 线程 执行 结果 合并 操作 ， 因 为 我 们 使 用 了 主线 程 来 完成 这 个 任务 。 这 也 是 把 
屏障 计数 值 设 为 工作 线程 数 加 1 的 原因 ， 主 线程 也 作为 其 中 的 一 个 候选 线程 。 
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如 果 只 用 一 个 线程 去 完成 800 万 个 数 的 堆 排序 ， 那 么 与 图 11-16 中 的 程序 相 比 ， 我 们 将 能 看 
到 图 11-16 中 的 程序 在 性 能 上 有 显著 提升 。 在 8 核 处 理 器 系统 上 ， 单 线程 程序 对 800 万 个 数 进行 
排序 需要 12.14 秒 。 同 样 的 系统 ， 使 用 8 个 并 行 线程 和 1 个 合并 结果 的 线程 ， 相 同 的 800 万 个 数 
的 排序 仅 需 要 1.91 秒 ， 速 度 提 升 了 6 倍 。 = 


11.7 WS 


本 章 介绍 了 线程 的 概念 ， 讨 论 了 现 有 的 创建 和 销毁 线程 的 POSIX.1 RIB; 此 外 ， 还 介绍 了 线 
BAe, Wey 5 个 基本 的 同步 机 制 〈 互 斥 量 、 读 写 锁 、 条 件 变量 、 自 旋 锁 以 及 屏障 )， 了 
解 了 如 何 使 用 它们 来 保护 共享 资源 。 


习题 


11.1 修改 图 11-4 所 示 的 实例 代码 ， 正 确 地 在 两 个 线程 之 间 传 递 结构 。 

11.2 在 图 11-14 所 示 的 实例 代码 中 ， 需 要 另外 添加 什么 同步 《如 果 需 要 的 话 ) 可 以 使 得 主线 程 改 
变 与 挂 起 作业 关联 的 线程 ID? 这 会 对 job_remove 函数 产生 什么 影响 ? 

11.3. 把 图 11-15 中 的 技术 运用 到 工作 线程 实例 (图 11-1 和 图 11-14) 中 实现 工作 线程 函数 。 不 要 
忘记 更 新 queue init 函数 对 条 件 变量 进行 初始 化 ， 修 改 job insert 和 job append 
函数 给 工作 线程 发 信号 。 会 出 现 什么 样 的 困难 ? 

11.4 下 面 哪个 步骤 序列 是 正确 的 ? 

(OD 对 互 斥 量 加 锁 (pthread mutex lock). 
(2) 改变 互 斥 量 保护 的 条 件 。 
(3) 给 等 待 条 件 的 线程 发 信号 (pthread cond broadcast). 
422 (4) 对 互 斥 量 解 锁 (pthread mutex unlock). 
或 者 
(1) 对 互 斥 量 加 锁 (pthread_mutex_lock)。 
(2) 改变 互 斥 景 保护 的 条 件 。 
(3) 对 互 斥 量 解锁 Cpthread_mutex_unlock). 
(4) 给 等 待 条 件 的 线程 发 信号 (pthread cond broadcast). 
11.5 实现 屏障 需要 什么 同步 原 语 ? 给 出 pthread barrier wait 函数 的 一 个 实现 。 
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12.1 引言 


第 11 章 讲 了 线程 以 及 线程 同步 的 基础 知识 。 本 章 将 讲解 控制 线程 行为 方面 的 详细 内 容 ， 介 
绍 线程 属性 和 同步 原 语 属 性 。 前 面 的 章节 中 使 用 的 都 它们 的 默认 行为 ， 没 有 进行 详细 介绍 。 

接 下 来 还 将 介绍 同一 进程 中 的 多 个 线程 之 间 如 何 保 持 数 据 的 私有 性 。 最 后 讨论 基于 进程 的 系 
统 调用 如 何 与 线程 进行 交互 。 


12.2 线程 限制 


在 2.5.4 节 中 讨论 了 sysconf 函数 。Single UNIX Specification 定义 了 与 线程 操作 有 关 的 一 些 
限制 ， 图 2-11 并 没有 列 出 这 些 限制 。 与 其 他 的 系统 限制 一 样 ， 这 些 限制 也 可 以 通过 sysconf M 
数 进行 查询 。 图 12-1 总 结 了 这 些 限 制 。 


PTHREAD DESTRUCTOR 线程 退出 时 操作 系统 实现 试图 销毁 线 程 特 | SC THREAD DESTRUCTOR. 
ITERATIONS 定数 据 的 最 大 次 数 〈 见 12.6 5) ITERRTIONS 


PTHREAD KEYS MAX 进程 可 以 创建 的 键 的 最 大 数目 〈 见 12.6 355 SC THREAD KEYS MAX 

PTHREAD STACK MIN 一 个 线程 的 栈 可 用 的 最 小 字 节 数 (3,123 450 | SC THREAD STACK MIN 

PTHREAD THREADS, MAX 进程 可 以 创建 的 最 大 线程 数 (0.12.3 49) | SC THREAD THREADS MAX 

12-1 线程 限制 和 sysconf 的 name 参数 

与 sysconf 报告 的 其 他 限制 一 样 ， 这 些 限 制 的 使 用 是 为 了 增强 应 用 程序 在 不 同 的 操作 系统 
实现 之 闻 的 可 移植 性 。 例 如 ， 如 果 应 用 程序 需要 为 它 管 理 的 每 个 文件 创建 4 个 线程 ， 但 是 系统 却 
并 不 允许 创建 所 有 这 些 线程 ， 这 时 可 能 就 必须 限制 当前 可 并 发 管理 的 文件 数 。 

12-2 给 出 了 本 书 描述 的 4 种 操作 系统 实现 中 线程 限制 的 值 .如 果 操 作 系统 实现 的 限制 是 不 
确定 的 ， 烈 出 的 值 就 是 “没有 确定 的 限制 ”(no limit)。 但 这 并 不 意味 着 值 是 无 限制 的 。 


NEN NEN FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 


PTHREAD _ | PTHREAD DESTRUCTOR ITERATIONS | ITERATIONS 没有 确定 的 限制 | 





PTHREAD KEYS MAX 没有 确定 的 限制 
PTHREAD STACK MIN 8192 
PTHREAD THREADS MAX 没有 确定 的 限制 | 没有 确定 的 限制 | 没有 确定 的 限制 | 没有 确定 的 限制 





图 12-2 ”线程 配置 限制 的 实例 
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| 注意 ， 虽 然 某 个 操作 系统 实现 可 能 没有 提供 访问 这 些 限 制 的 方法 ， 但 这 并 不 意味 着 这 些 限 制 
: 不 存在 ， 这 只 是 意味 着 操作 系统 实现 没有 为 使 用 syscont 访问 这 些 值 提供 可 用 的 方法 。 


12.3 ”线程 属性 


pthread 接口 允许 我 们 通过 设置 每 个 对 象 关 联 的 不 同属 性 来 细 调 线程 和 同步 对 象 的 行为 。 通 
常 ， 管 理 这些 属 性 的 函数 都 遵循 相同 的 模式 。 

(1) 每 个 对 象 与 它 自己 类 型 的 属性 对 象 进行 关联 (线程 与 线程 属性 关联 ， 互 斥 量 与 互 斥 量 属 
性 关联 ， 等 等 )。 一 个 属性 对 象 可 以 代表 多 个 属性 。 属 性 对 象 对 应 用 程序 来 说 是 不 透明 的 。 这 意 
味 着 应 用 程序 并 不 需要 了 解 有 关 属 性 对 象 内 部 结构 的 详细 细节 ， 这 样 可 以 增强 应 用 程序 的 可 移植 

425| 性 。 取而代之 的 是 ， 需 要 提供 相应 的 函数 来 管理 这 些 属性 对 象 。 
(2) 有 一 个 初始 化 函数 ， 把 属性 设置 为 默认 值 。 

(3) 还 有 一 个 销 裔 属性 对 象 的 沙 数 。 如 果 初 始 化 函数 分 配 了 与 属性 对 象 关 联 的 资源 ， 销 筑 函 
数 负责 释放 这 些 资源 。 

(4) 每 个 属性 都 有 一 个 从 属性 对 象 中 获取 属性 值 的 函数 。 由 于 函数 成 功 时 会 返回 0， 失败 时 会 返回 
错误 编号 ,所 以 可 以 通过 把 属性 值 存 储 在 函数 的 某 一 个 参数 指定 的 内 存单 元 中 , 把 属性 值 返回 给 调用 者 。 

(5) 每 个 属性 都 有 一 个 设置 属性 值 的 函数 。 在 这 种 情况 下 ， 属 性 值 作为 参数 按 值 传递 。 

在 第 11 章 所 有 调用 pthread_create 函数 的 实例 中 ， 传 入 的 参数 都 是 空 指针 ， 而 不 是 指向 
pthread attr t 结构 的 指针 。 可 以 使 用 pthread attr_t 结构 修改 线程 默认 属性 ， 并 把 这 些 
属性 与 创建 的 线程 联系 起 来 。 可 以 使 用 pthread attr init 函数 初始 化 pthread attr tH 
构 。 在 调用 pthread attr init 以 后 ，pthread_attr_t 结构 所 包含 的 就 是 操作 系统 实现 支 
持 的 所 有 线程 属性 的 默认 值 。 


#include <pthread.h> 


int pthread attr init(pthread attr t *attr); 
int pthread attr destroy(pthread attr t *atir); 
两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错 误 编 号 


如 果 要 反 初 始 化 pthread_attr_t 结构 ， 可 以 调用 pthread_attr_destroy 函数 。 如 果 
pthread attr init 的 实现 对 属性 对 象 的 内 存 空 间 是 动态 分 配 的 , pthread attr destroy 
就 会 释放 该 内 存 空间 。 除 此 之 外 ，pthread_attr_destroy 还 会 用 无 效 的 值 初 始 化 属性 对 象 ， 
因此 ， 如 果 该 属性 对 象 被 误 用 ， 将 会 导致 pthread_create 水 数 返回 错误 码 。 

图 12-3 总 结 了 POSIX.1 定义 的 线程 属性 。POSIX.1 还 为 线程 执行 调度 (Thread Execution 
Scheduling) 选项 定义 了 额外 的 属性 ， 用 以 支持 实时 应 用 ， 但 我 们 并 不 打算 在 这 里 讨论 这 些 属性 。 
图 12-3 同时 给 出 了 各 个 操作 系统 平台 对 每 个 线程 属性 的 支持 情况 。 





detachstate 线程 的 分 离 状态 属性 


guardsize | 线程 栈 末 尾 的 警戒 缓冲 区 大 小 〔 字 节 数 ) 
stackaddr 线程 栈 的 最 低地 址 
stacksize 线程 栈 的 最 小 长 度 〈 字 节 数 ) 


12-3 POSIX.1 线程 属性 
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11.5 节 介绍 了 分 离线 程 的 概念 。 如 果 对 现 有 的 某 个 线程 的 终止 状态 不 感 兴趣 的 话 ， 可 以 使 用 
pthread detach 函数 让 操作 系统 在 线程 退出 时 收回 它 所 占用 的 资源 。 [427] 
如 果 在 创建 线程 时 就 知道 不 需要 了 解 线程 的 终止 状态 ， 就 可 以 修改 pthread attr t 结构 中 的 
detachstate 线程 属性 ， 让 线程 一 开始 就 处 于 分 离 状 态 。 可 以 使 用 pthread attr setdetachstate 
函数 把 线程 属性 detachstate 设置 成 以 下 两 个 合法 值 之 一 : PTHRERAD_CRERATE_DETRCHED， 以 分 离 状态 
启动 线程 ， 或 者 PTHREAD CREATE JOINRABIE， 正 常 启动 线程 ， 应 用 程序 可 以 获取 线程 的 终止 状态 。 


#include <pthread.h> 


int pthread attr getdetachstate(const pthread attr t *restrict amr, 
int *detachstate) ; 


int pthread attr setdetachstate(pthread attr t *affr, int *detachstate) ; 
AAT PARMAR: 车 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 





可 以 调用 pthread attr_getdetachstate 隙 数 获取 当前 的 detachstate 线程 属性 。 第 二 个 参 
数 所 指向 的 整数 要 么 设置 成 PTHREAD CREATE DETACHED, HABER PTHREAD CREATE 
JOINABLE， 具 体 要 取决 于 给 定 pthread_attr_t 结构 中 的 属性 值 。 


n Sc 
12-4 给 出 了 一 个 以 分 离 状态 创建 线程 的 函数 。 


#include "apue.h" 
#include <pthread.h> 


int 
makethread(void *(*fn) (void *), void *arg) 
{ 

int err; 

pthread_t tid; 

pthread_attr_t attr; 


err = pthread attr init(&attr); 
if (err != 0) 

return terr); 
err = pthread attr setdetachstate(&attr, PTHREAD CREATE DETACHED); 
if (err -- 0) 

err = pthread create(&tid, &attr, fn, arg): 
pthread attr destroy(&attr); 
return(err); 


1244 ”以 分 离 状 态 创建 线程 

注意 ， 此 例 忽略 了 pthread attr destroy 函数 调用 的 返回 值 。 在 这 个 实例 中 ， 我 们 对 线 
程 属 性 进行 了 合理 的 初始 化 ， 因 此 pthread attr destroy 应 该 不 会 失败 。 但是， 如 果 
pthread attr destroy 确实 出 现 了 失败 的 情况 ， 将 难以 清理 ;必须 销毁 刚刚 创建 的 线程 ， 也 
许 这 个 线程 可 能 已 经 运行 ， 并 且 与 pthread attr destroy 函数 可 能 是 异步 执行 的 。 忽 略 
pthread attr destroy 的 错误 返回 可 能 出 现 的 最 坏 情况 是 ， 如 果 ptnread attr init B 
经 分 配 了 内 存 空间 ， 就 会 有 少量 的 内 存 浊 漏 。 另 一 方面 ， 如 果 pthread_attr_init 成 功 地 对 
线程 属性 进行 了 初始 化 , 但 之 后 pthread_attr_destroy 的 清理 工作 失败 ， 那 么 将 没有 任何 补 
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救 策 略 ， 因 为 线程 属性 结构 对 应 用 程序 来 说 是 不 透明 的 ， 可 以 对 线程 属性 结构 进行 清理 的 唯一 接 
口 是 pthread_attr_destroy, (HEARTS. " 


对 于 遵循 POSIX 标准 的 操作 系统 来 说 ， 并 不 一 定 要 支持 线程 栈 属性 , 但 是 对 于 遵循 Single UNIX 
Specification 中 XSI 选项 的 系统 来 说 ， 支 持 线程 栈 属 性 就 是 必需 的 。 可 以 在 编译 阶段 使 用 POSTIX_ 
THREAD ATTR STACKADDR 和 POSIX THREAD ATTR STACKSIZE 符号 来 检查 系统 是 否 支 持 每 一 
个 线程 栈 属 性 。 如 果 系 统 定义 了 这 些 符 号 中 的 一 个 ， 就 说 明 它 支 持 相 应 的 线程 栈 属 性 。 或 者 ， 也 可 以 
在 运行 阶段 把 SC THREAD ATTR STACKADDR 和 _SC_THREAD_RTTR_STRCKSIZE 参数 传 给 
sysconf 函数 ， 检 查 运 行 时 系统 对 线程 栈 属 性 的 支持 情况 。 

可 以 使 用 函数 pthread_attr_getstack Ñ pthread_attr_setstack 对 线程 栈 属性 进 
行 管理 。 


#include «pthread.h» 


int pthread attr getstack(const pthread attr t *restrict attr, 
void **restrict sfackaddr, 
size t *restrict stacksize) ; 


int pthread attr setstack(pthread attr t *atfr, 
void *stackaddr, size t stacksize); 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


对 于 进程 来 说 ， 虚 地 址 空间 的 大 小 是 固定 的 。 因 为 进程 中 只 有 一 个 栈 ， 所 以 它 的 大 小 通常 不 
是 问题 。 但 对 于 线程 来 说 ， 同 样 大 小 的 虚 地 址 空间 必须 被 所 有 的 线程 栈 共 享 。 如 果 应 用 程序 使 用 
了 许多 线程 ， 以 致 这 些 线程 栈 的 累计 大 小 超过 了 可 用 的 虚 地 址 空间 ， 就 需要 减少 默认 的 线程 栈 大 
小 。 另 一 方面 ， 如 果 线 程 调用 的 函数 分 配 了 大 量 的 自动 变量 ， 或 者 调用 的 函数 涉及 许多 很 深 的 栈 
Wi (stack frame)， 那 么 需要 的 栈 大 小 可 能 要 比 默认 的 大 。 

如 果 线 程 栈 的 虚 地 址 空间 都 用 完了 ， 那 可 以 使 用 malloc 或 者 mmap (A 14.8 节 ) RAH 
代 的 栈 分 配 空间 ， 并 用 pthread_attr_setstack 函数 来 改变 新 建 线程 的 栈 位 置 。 由 stackaddr 
参数 指定 的 地 址 可 以 用 作 线 程 栈 的 内 存 范围 中 的 最 低 可 寻 址 地 址 ， 该 地 址 与 处 理 器 结构 相应 的 边 
界 应 对 齐 。 当 然 ， 这 要 假设 malloc 和 mmap 所 用 的 虚 地 址 范围 与 线程 栈 当 前 使 用 的 虚 地 址 范围 
不 同 。 

stackaddr 线程 属性 被 定义 为 栈 的 最 低 内 存 地 址 ， 但 这 并 不 一 定 是 栈 的 开始 位 置 。 对 于 一 个 给 
定 的 处 理 器 结构 来 说 , 如 果 栈 是 从 高 地 址 向 低地 址 方向 增长 的 , 那么 stackaddr 线程 属性 将 是 栈 的 
结尾 位 置 ， 而 不 是 开始 位 置 。 

应 用 程序 也 可 以 通过 pthreaq_attr_getstacksize 和 Pthread_attr_setstacksize 函 

数 读 取 或 设置 线程 属性 stacksize。 


#include <pthread.h> 





int pthread attr getstacksize(const pthread attr t *restrict afir, 
size t *restrict stacksize) ; 


int pthread attr setstacksize (pthread attr t *atfr, size t stacksize); 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0 否则， 返回 错误 编号 





如 果 希 望 改变 默认 的 栈 大 小 , 但 又 不 想 自 己 处 理 线程 栈 的 分 配 问 题 , 这 时 使 用 pthread_attr_ 
setstacksize 函数 就 非常 有 用 。 设 置 stacksize 属性 时 ， 选 择 的 stacksize 不 能 小 于 PTHREAD_ 


124 同步 属性 345 


STACK MIN. 

线程 属性 guardsize 控制 着 线程 栈 末尾 之 后 用 以 避免 栈 溢出 的 扩展 内 存 的 大 小 。 这 个 属性 默认 
值 是 由 具体 实现 来 定义 的 ， 但 常用 值 是 系统 页 大 小 。 可 以 把 guardsize 线程 属性 设置 为 0， 不 允许 
属性 的 这 种 特征 行为 发 生 ， 在 这 种 情况 下 ， 不 会 提供 警戒 缓冲 区 。 同 样 ， 如 果 修 改 了 线程 属性 
stackadcdr， 系 统 号 认为 我 们 将 自己 管理 栈 ， 进 而 使 栈 警戒 缓冲 区 机 制 无 效 ， 这 等 同 于 把 euardsize 
线程 属性 设置 为 0。 


#include <pthread.h> 


iint pthread attr getguardsize(const pthread attr t *restrict attr, 
size t *restrict guardsize) ; 


int pthread attr setguardsize(pthread attr t *attr, size t guardsize); 


两 个 函数 的 返回 值 : FRH, EO: SM, BRAS 





如 果 guardsize 线程 属性 被 修改 了 , 操作 系统 可 能 会 把 它 取 为 页 大 小 的 整数 倍 。 如 果 线 程 的 栈 
指针 溢出 到 警戒 区 域 ， 应 用 程序 就 可 能 通过 信和 号 接收 到 出 错 信息 。 i 

Single UNIX Specification 还 定义 了 一 些 其 他 的 可 选 线程 属性 供 实时 应 用 程序 使 用 ， 但 在 这 里 
不 讨论 这 些 属性 。 | 

线程 还 有 一 些 其 他 的 pthread attr t 结构 中 没有 表示 的 属性 : 可 撤销 状态 和 可 撤销 类 型 。 
我 们 将 在 12.7 节 中 讨论 它们 。 


12.4 同步 属性 


就 像 线程 具有 属性 一 样 ， 线 程 的 同步 对 象 也 有 属性 。11.6.7 节 中 介绍 了 自 旋 锁 ， 它 有 一 个 属 
性 称 为 进程 共享 属性 。 本 节 讨 论 互 斥 量 属性 、 读 写 锁 属性 、 条 件 变 量 属性 和 屏障 属性 。 


124.1 HERPE 


互 斥 量 属 性 是 用 pthread_mutexattr_t 结构 表示 的 。 第 11 章 中 每 次 对 互 斥 量 进行 初始 化 
时 , 都 是 通过 使 用 PTHREAD MUTEX INITIALIZER 常量 或 者 用 指向 互 斥 量 属性 结构 的 空 指针 作 
为 参数 调用 pthread mutex init 函数 ， 得 到 互 斥 量 的 默认 属性 。 

对 于 非 默 认 属性 , 可 以 用 pthread mutexattr init 初始 化 pthread mutexattr 七 结 
构 ， 用 pthread_mutexattr_destroy 来 反 初始 化 。 


#include <pthread.h> 


int pthread_mutexattr_init (pthread_mutexattr_t *attr); 


int pthread mutexattr destroy(pthread mutexattr t *attr); 


两 个 函数 的 返回 值 ， 考 成功， 返回 0， 否则 ， 返 回 错 误 编 号 





pthread mutexattr init 函数 将 用 默认 的 互 斥 量 属性 初始 化 pthread mutexattr t 
结构 。 值 得 注意 的 3 个 属性 是 ， 进 程 共享 属性 、 健 壮 属 性 以 及 类 型 属性 。POSIX.1 中 ， 进 程 共享 
属性 是 可 选 的 。 可 以 通过 检查 系统 中 是 否定 义 了 _POSIX_THREAD_PROCESS_SHARED 符号 来 判 
断 这 个 平台 是 否 支 持 进程 共享 这 个 属性 ， 也 可 以 在 运行 时 把 SC_THRERAD_PROCESS_SHARED 参 
数 传 给 sysconf 函数 进行 检查 。 虽 然 这 个 选项 并 不 是 遵循 POSIX 标准 的 操作 系统 必须 提供 的 ， 
但 是 Single UNIX Specification 要 求 遵循 XSI 标准 的 操作 系统 支持 这 个 选项 。 
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在 进程 中 ， 多 个 线程 可 以 访问 同一 个 同步 对 象 。 正 如 在 第 11 章 中 看 到 的 ， 这 是 默认 的 行为 。 
在 这 种 情况 下 ， 进 程 共享 互 斥 量 属性 需 设 置 为 PTHREAD_PROCESS_PRIVATE。 

我 们 将 在 第 14 章 和 第 15 章 中 看 到 ， 存 在 这 样 的 机 制 : 允许 相互 独立 的 多 个 进程 把 同一 个 内 
存 数据 块 映 射 到 它们 各 自 独立 的 地 址 空间 中 。 就 像 多 个 线程 访问 共享 数据 一 样 ， 多 个 进程 访问 共 
享 数 据 通常 也 需要 同步 。 如 果 进 程 共 享 互 斥 量 属性 设置 为 PTHREAD_PROCESS_SHARED， 从 多 个 
进程 彼此 之 间 共 享 的 内 存 数 据 块 中 分 配 的 互 斥 量 就 可 以 用 于 这 些 进程 的 同步 。 

可 以 使 用 pthread mutexattr. getpshared 函数 查询 pthread mutexattr t 结构 ， 
得 到 它 的 进程 共享 属性 ， 使 用 pthread mutexattr setpshared 函数 修改 进程 共享 属性 。 


#include <pthread.h> 


int pthread mutexattr getpshared(const pthread_mutexattr_t 
*restrict attr, 
int *restrict pshared); 


int pthread mutexattr setpshared(pthread mutexattr t *aftr, 
int pshared) ; 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


进程 共享 互 斥 量 属性 设置 为 PTHREAD_PROCESS_PRIVATE 时 ， 人 允许 pthread 线程 库 提 供 更 
有 效 的 互 斥 量 实现 , 这 在 多 线程 应 用 程序 中 是 默认 的 情况 。 在 多 个 进程 共享 多 个 互 斥 量 的 情况 下 ， 

pthread 线程 库 可 以 限制 开销 较 大 的 互 斥 量 实现 。 

互 斥 量 健壮 属性 与 在 多 个 进程 间 共 享 的 互 斥 量 有 关 .。 这 意味 着 , 当 持 有 互 斥 量 的 进程 终止 时 ， 
需要 解决 互 斥 量 状 态 恢复 的 问题 。 这 种 情况 发 生 时 ， 互 斥 量 处 于 锁定 状态 ， 恢 复 起 来 很 困难 。 其 
他 阻塞 在 这 个 锁 的 进程 将 会 一 直 阻 塞 下 去 。 

可 以 使 用 pthread mutexattr getrobust 函数 获取 健壮 的 互 斥 量 属 性 的 值 。 可 以 调 
用 pthread_mutexattr_setrobust 函数 设置 健 半 的 互 斥 量 属性 的 值 。 


#include «pthread.h» 





int pthread mutexattr getrobust(const pthread mutexattr t 
*restrict atr, 
int *restrict robust); 


int pthread mutexattr setrobust(pthread mutexattr t *attr, 
int robust); 


两 个 函数 的 返回 值 : BD, BAO: FM, BRAS 





健壮 属性 取 值 有 两 种 可 能 的 情况 。 默 认 值 是 PTHREAD_MUTEX_STALLED， 这 意味 着 持 有 互 
斥 量 的 进程 终止 时 不 需要 采取 特别 的 动作 。 这 种 情况 下 ， 使 用 互 斥 量 后 的 行为 是 未 定义 的 ， 等 待 
该 互 斥 量 解锁 的 应 用 程序 会 被 有 效 地 “ 拖 住 ”>。 另 一 个 取 值 是 PTHRERAD_MUTEX_ROBUST。 这 个 值 将 
导致 线程 调用 pthread mutex lock 获取 锁 ， 而 该 锁 被 另 一 个 进程 持 有 ， 但 它 终 止 时 并 没有 对 
该 锁 进 行 解 锁 , 此 时 线程 会 阻塞 , 从 pthread mutex lock 返回 的 值 为 EOWNERDEAD 而 不 是 0。 
应 用 程序 可 以 通过 这 个 特殊 的 返回 值 获知 ， 若 有 可 能 《要 保护 状态 的 细节 以 及 如 何 进行 恢复 会 因 
不 同 的 应 用 程序 而 异 )， 不 管 它们 保护 的 互 斥 量 状态 如 何 ， 都 需要 进行 恢复 。 

使 用 健壮 的 互 斥 量 改变 了 我 们 使 用 pthread_mutex_lock 的 方式 ， 因 为 现在 必须 检查 3 个 
返回 值 而 不 是 之 前 的 两 个 : 不 需要 恢复 的 成 功 、 需 要 恢复 的 成 功 以 及 失败 。 但 是 ， 即 使 不 用 健壮 
的 互 斥 量 ， 也 可 以 只 检查 成 功 或 者 失败 。 
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在 本 书 的 4 个 平台 中 ,只 有 Linux 3.2.0 目前 支持 健壮 的 线程 互 斥 量 ,Solaris 10 只 在 它 的 Solaris 
| 线程 库 中 支持 健壮 的 线程 互 斥 量 ( 参阅 Solaris 手册 的 mutex_init(3C) 获 取 相 关 的 信息 )。 但 是 
| Solaris 11 支持 健壮 的 线程 互 斥 醒 。 


如 果 应 用 状态 无 法 恢复 ， 在 线程 对 互 斥 量 解 锁 以 后 ， 该 互 斥 量 将 处 于 永久 不 可 用 状态 。 为 了 
避免 这 样 的 问题 ， 线 程 可 以 调用 pthread mutex consistent 函数 ， 指 明 与 该 互 斥 量 相关 的 
状态 在 互 斥 量 解锁 之 前 是 一 致 的 。 


#include <pthread.h> 


int pthread_mutex_consistent (pthread_mutex_t *mutex); 





如 果 线 程 没有 先 调 用 pthread mutex consistent 就 对 互 斥 量 进 行 了 解锁 ， 那 么 其 他 试 
图 获取 该 互 斥 量 的 阻塞 线程 就 会 得 到 错误 码 ENOTRECOVERRBLE 。 如 果 发 生 这 种 情况 ， 互 斥 量 将 
不 再 可 用 。 线程 道 过 提前 调用 pthread_mutex_consistent， 能 让 互 斥 量 正常 工作 ， 这 样 它 就 
可 以 持续 被 使 用 。 
类 型 互 斥 量 属性 控制 着 互 斥 量 的 锁定 特性 。POSIX.1 定义 了 4 种 类 型 。 
PTHREAD MUTEX NORMAL 一 种 标准 互 斥 量 类 型 ， 不 做 任何 特殊 的 错误 检查 或 死 锁 检测 。 
PTHREAD MUTEX ERRORCHECK 此 互 斥 量 类 型 提供 错误 检查 。 
PTHREAD MUTEX RECURSIVE ”此 互 斥 量 类 型 允许 同一 线程 在 互 斥 量 解锁 之 前 对 该 互 斥 量 
进行 多 次 加 锁 。 递 归 互 斥 量 维护 锁 的 计数 ， 在 解锁 次 数 和 
加 锁 次 数 不 相 同 的 情况 下 ， 不 会 释放 锁 。 所 以 ， 如 果 对 一 
个 递归 互 斥 量 加 锁 两 次 ， 然 后 解锁 一 次 ， 那 么 这 个 互 斥 量 
将 依然 处 于 加 锁 状 态 ， 对 它 再 次 解锁 以 前 不 能 释放 该 锁 。 
PTHREAD MUTEX DEFAULT 此 互 斥 量 类 型 可 以 提供 默认 特性 和 行为 。 操 作 系统 在 实现 它 
的 时 候 可 以 把 这 种 类 型 自由 地 映射 到 其 他 互 斥 量 类 型 中 的 
一 种 。 例如 ，Linux 3.2.0 把 这 种 类 型 映射 为 普通 的 互 斥 量 类 
型 ， 而 FreeBSD 8.0 则 把 它 映射 为 错误 检查 互 斥 量 类 型 。 
这 4 种 类 型 的 行为 如 图 12-5 所 示 。“ 不 占用 时 解锁 ”这 一 栏 指 的 是 ， 一 个 线程 对 被 另 一 个 线 
程 加 锁 的 互 斥 量 进行 解锁 的 情况 。“ 在 已 解锁 时 解锁 ”这 一 栏 指 的 是 ， 当 一 个 线程 对 已 经 解锁 的 
互 斥 量 进行 解锁 时 将 会 发 生 什 么 ， 这 通常 是 编码 错误 引起 的 。 


Lo | 用 不 占用 时 解锁 ? 在 己 解 锁 时 解锁 ? 


| PTHREAD MUTEX NORMAL | MUTEX, NORMAL n wet | == — | 
PTHREAD MUTEX ERRORCHECK Bout 返回 错误 返回 错误 
PTHREAD MUTEX RECURSIVE 允许 返回 错误 返回 错误 
PTHREAD MUTEX DEFAULT 未 定义 未 定义 未 定义 


12-5 ” 互 斥 量 类 型 行为 
可 以 用 pthread_mutexattr_gettype 函数 得 到 互 斥 量 类 型 属性 ， 用 pthread mutexattr 
settype 函数 修改 互 斥 量 类 型 属性 。 


#include <pthread.h> 





int pthread_mutexattr_gettype (const pthread mutexattr t *restrict attr, int *restrict type); 
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回忆 11.6.6 节 中 学 过 的 ， 互 斥 量 用 于 保护 与 条 件 变量 关联 的 条 件 。 在 阻塞 线程 之 前 ，Pthread_ 
cond wait 和 pthread cond timedwait 羡 数 释放 与 条 件 相关 的 互 斥 量 。 这 就 允许 其 他 线程 获取 
互 斥 量 、 改 变 条 件 、 释 放 互 斥 量 以 及 给 条 件 变量 发 信号 。 既 然 改变 条 件 时 必须 占有 互 斥 量 ， 使 用 递归 互 
斤 量 就 不 是 一 个 好 主意 。 如 果 递 归 互 斥 量 被 多 次 加 锁 ， 然 后 用 在 调用 pthread_cond_wait 函数 中 ， 
那么 条 件 永远 都 不 会 得 到 满足 ， 因 为 bthread_cond_wait 所 做 的 解锁 操作 并 不 能 释放 互 斥 量 。 

如 果 需 要 把 现 有 的 单线 程 接口 放 到 多 线程 环境 中 ， 递 归 互 斥 量 是 非常 有 用 的 ， 但 由 于 现 有 程 
序 兼容 性 的 限制 ， 不 能 对 函数 接口 进行 修改 。 然 而 ， 使 用 递归 锁 可 能 很 难处 理 ， 因 此 应 该 只 在 没 
有 其 他 可 行 方案 的 时 候 才 使 用 它们 。 


zs 实例 


12-6 描述 了 一 种 情况 , 在 这 种 情况 中 递归 互 斥 量 看 起 来 像 是 在 解决 并 发 问题 。 假设 funcl 
和 func2 是 函数 库 中 现 有 的 函数 ， 其 接口 不 能 改变 ， 因 为 存在 调用 这 两 个 接 只 的 应 用 程序 ， 而 
且 应 用 程序 不 能 改动 。 


main 


a (x) 


pthread mutex_lock(x->lock) 






func2(x) 


pthread_mutex_unlock(x->lock) 


func2 (x) 


pthread mutex lock(x-»1lock) 


Pucci neci IEEE x->lock) 
12-6 ”使 用 递归 锁 的 一 种 可 能 情况 
为 了 保持 接口 跟 原 来 相同 ， 我 们 把 互 斥 量 蔷 入 到 了 数据 结构 中 ， 把 这 个 数据 结构 的 地 址 〈x) 
作为 参数 传 入 。 这 种 方案 只 有 在 为 此 数据 结构 提供 分 配 函 数 时 才 可 行 ， 所 以 应 用 程序 并 不 知道 数 
据 结构 的 大 小 《假设 我 们 在 其 中 增加 互 斥 量 之 后 必须 扩大 该 数据 结构 的 大 小 )。 
如 果 在 最 早 定义 数据 结构 时 ， 预 留 了 足够 的 可 填充 字段， 允许 把 某 些 填充 字段 替换 成 互 斥 量 ， 这 
| 种 方法 也 是 可 行 的 。 不 过 遗 钴 的 是 ， 大 多 数 程序 员 并 不 善于 预测 未 来 ， 所 以 这 并 不 是 普遍 可 行 的 实践 。 


如 果 funcl 和 func2 函数 都 必须 操作 这 个 结构 ， 而 且 可 能 会 有 一 个 以 上 的 线程 同时 访问 该 
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数据 结构 ， 那 么 funcl 和 func2 必须 在 操作 数据 以 前 对 互 斥 量 加 锁 。 如 果 funcl 必须 调用 
func2， 这 时 如 果 互 斥 量 不 是 递归 类 型 的 ， 那 么 就 会 出 现 死 锁 。 如 果 能 在 调用 func2 之 前 释放 
HFE, E func2 返回 后 重新 获取 互 斥 量 ， 那 么 就 可 以 避免 使 用 递归 互 斥 量 ， 但 这 也 给 其 他 的 
线程 提供 了 机 会 ， 其 他 的 线程 可 以 在 funci 执行 期 间 抓 住 互 斥 量 的 控制 ， 修 改 这 个 数据 结构 。 
这 也 许 是 不 可 接受 的 ， 当 然 具体 的 情况 要 取决 于 互 斥 量 试图 提供 什么 样 的 保护 。 

12-7 显示 了 这 种 情况 下 使 用 递归 互 斥 量 的 一 种 替代 方法 。 通 过 提供 func2 函数 的 私有 版 
本 ， 称 之 为 func2_locked 函数 ， 可 以 保持 funcl 和 func2 函数 接口 不 变 ， 而 且 避 免 使 用 递 
归 互 斥 量 。 要 调用 £func2 locked 函数 ， 必 须 占 有 了 骨 入 在 数据 结构 中 的 互 斥 量 ， 这 个 数据 结构 
的 地 址 是 作为 参数 传 入 的 。func2_locked 的 函数 体 包含 func2 WEE, func: 现在 只 是 获取 
互 斥 量 ， 调 用 func2_locked， 然 后 释放 互 斥 量 。 


main 


func} (x) 


pthread_mutex_lock(x->lock) 


func2 locked(x) 








pthread mutex unlock(x-»lock) 


Fone2(x) 


pthread mutex_lock(x->lock) 
func2_locked(x) 
pthread_mutex_unlock(x->lock) 
图 12-7 ”避免 使 用 递归 锁 的 一 种 可 能 情况 
如 果 并 不 一 定 要 保持 库 函 数 接口 不 变 ， 就 可 以 在 每 个 函数 中 增加 第 二 个 参数 表明 这 个 结构 是 
否 被 调用 者 锁定 。 但 是 ， 如 果 可 以 的 话 ， 保 持 接口 不 变通 常 是 更 好 的 选择 ， 可 以 避免 实现 过 程 中 
人 为 加 入 的 东西 对 原 有 系统 产生 不 良 影 响 。 
提供 加 锁 和 不 加 锁 版 本 的 函数 ， 这 样 的 策略 在 简单 的 情况 下 通常 是 可 行 的 。 在 更 加 复杂 的 情况 下 ， 


比如 ， 库 需要 调用 库 以 外 的 函数 ， 而 且 可 能 会 再 次 回调 库 中 的 函数 时 ， 就 需要 依赖 递归 锁 。 


实例 


图 12-8 中 的 程序 解释 了 有 必要 使 用 递归 互 斥 量 的 男 一 种 情况 。 这 里 ， 有 一 个 “超时 ”(timeout) 
函数 ， 它 允许 安排 另 一 个 函数 在 未 来 的 某 个 时 间 运 行 。 假 设 线程 并 不 是 很 昂贵 的 资源 ， 就 可 以 为 每 
个 挂 起 的 超时 函数 创建 一 个 线程 。 线 程 在 时 间 未 到 时 将 一 直 等 待 ， 时 间 到 了 以 后 再 调用 请 求 的 函数 。 
#include <pthread.h> 


#finclude <time.h> 
#include <sys/time.h> 
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extern int makethread(void *(*)(void *), void *); 


struct to info ( 


void (*to fn) (void *); /* function */ 
void *to arg: /* argument */ 
struct timespec to wait; /* time to wait */ 


#define SECTONSEC 1000000000 /* seconds to nanoseconds */ 


Kif !defined(CLOCK REALTIME) || defined(BSD) 
#define clock nanosleep(ID, FL, REQ, REM) nanosleep((REQ), (REM)) 
#tendif 


#ifndef CLOCK_REALTIME 
#define CLOCK_REALTIME 0 
#define USECTONSEC 1000 /* microseconds to nanoseconds */ 


void 
clock_gettime(int id, struct timespec *tsp) 


{ 


struct timeval tv; 


gettimecfday(&tv, NULL); 

tsp->tv_sec = tv.tv sec; 

tsp->tv_nsec = tv.tv_usec * USECTONSEC; 
} 
#endif 


void * 
timeout helper(void *arg) 
i 

struct to info *tip; 


tip = (struct to info *)arg:; 

clock nanosleep(CLOCK REALTIME, 0, &tip-»to wait, NULL); 
(*tip-»to fn) (tip-»to arg); 

free(arg); 

return(0); 


void 
timeout (const struct timespec *when, void (*func) (void *), void *arg) 
{ 

struct timespec now; 

struct to_info ‘ELD? 

int err; 


clock gettime(CLOCK REALTIME, &now); 
if ((when->tv_sec > now.tv sec) |l 
(when-»tv sec == now.tv sec && when-»tv nsec > now.tv nsec)) { 
tip = malloc(sizeof(struct to info)): 
if (tip !- NULL) ( 
tip-»to fn = func; 
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tip-»to arg = arg; 
tip->to wait.tv sec = when-»tv sec - now.tv sec; 
if (when-»tv nsec >= now.tv nsec) { 
tip-»to wait.tv nsec = when-»tv nsec - now.tv nsec; 
} eise { 
tip-»to wait.tv sec--; 
tip->to_wait.tv_nsec = SECTONSEC -~ now.tv nsec + 
when->tv_nsec; 
} 
err = makethread(timeout_helper, (void *)tip); 
if (err == 0} 
return; 
else 
free (tip); 


/* 

* We get here if (a) when <= now, or (b) malloc fails, or 

* (c) we can't make a thread, so we just call the function now. 
*/ 

(*func) (arg); 


pthread mutexattr t attr; 
pthread mutex t mutex; 


void 
retry(void *arg) 
( 
pthread, mutex lock(&mutex); 


/* perform retry steps ... */ 


pthread mutex unlock (&mutex); 


int 

main(void) 

{ 
int err, condition, arg; 
struct timespec when; 


if ({err = pthread mutexattr init(sattr)) != 0) 
err exit(err, "pthread mutexattr init failed"); 
if ((err = pthread mutexattr settype(&attr, 


PTHREAD MUTEX RECURSIVE)) !- 0) 
err exit(err, "can't set recursive type"); 
if ((err = pthread mutex init(&mutex, &attr)) != 0) 


err exit(err, "can't create recursive mutex"); 
/* continue processing ... */ 


pthread mutex lock(&mutex); 
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/* 
* Check the condition under the protection of a lock to 
* make the check and the call to timeout atomic. 


*/ 
if (condition) { 
/* 
* Calculate the absolute time when we want to retry. 
*/ 
Clock gettime (CLOCK REALTIME, &when); 
when.tv sec += 10; /* 10 seconds from now */ 


timeout(&when, retry, (void *)((unsigned long)arg)); 
) 


pthread mutex unlock(&mutex); 
/* continue processing ... */ 


exit (0); 


图 12-8 ”使 用 递归 互 斥 量 
如 果 我 们 不 能 创建 线程 , 或 者 安排 函数 运行 的 时 间 已 过 , 这 时 问题 就 出 现 了 。 在 这 些 情况 下 ， 
我 们 只 需 在 当前 上 下 文中 调用 之 前 请 求 运行 的 项 数 。 因 为 函数 要 获取 的 锁 和 我 们 现在 占有 的 锁 是 
同一 个 ， 所 以 除非 该 锁 是 递归 的 ， 否 则 就 会 出 现 死 锁 。 
在 图 12-4 中 我 们 使 用 makethread 函数 以 分 离 状 态 创建 线程 。 因 为 传递 给 timeout 函数 
的 func 函数 参数 将 在 未 来 运行 ， 所 以 我 们 不 希望 一 直 空 等 线程 结束 。 
可 以 调用 sleep 等 待 超时 到 期 ， 但 它 提供 的 时 间 粒 度 是 秒 级 的 。 如 果 希 望 等 待 的 时 间 不 是 整数 
秒 ， 就 需要 用 nanosleep 或 者 clock_nanosleep 函数 ， 它 们 两 个 提供 了 更 高 精度 的 休眠 时 间 。 
在 未 定义 CLOCK_RERLTIME 的 系统 中 ， 我 们 根据 nanosleep 定义 clock_nanosleep. 
| 然而 ，FreeBSD 8.0 定义 这 个 符号 支持 clock gettime 和 clock_settime， 但 并 不 支持 
clock nanosleep. ( 只 有 Linux 3.2.0 和 Solaris 10 目前 支持 clock nanosleep.) 
另外 ， 在 未 定义 CLOCK_REALTIME 的 系统 中 ， 我 们 提供 了 我 们 自己 的 clock gettime X 
| 现 ， 该 实现 调用 了 gettimeofday Jide ACE MURAT, 


timeout 的 调用 者 需要 占有 互 斥 量 来 检查 条 件 , 并 且 把 retry 函数 安排 为 原子 操作 .retry 
函数 试图 对 同一 个 互 斥 量 进行 加 锁 。 除 非 互 斥 量 是 递归 的 ， 否 则 ， 如 果 timeout 函数 直接 调用 
retry， 会 导致 死 锁 。 a 


12.4.2 读 写 锁 属 性 


读 写 锁 与 互 斥 量 类 似 ， 也 是 有 属性 的 。 可 以 用 pthread rwlockattr init 初始 化 
pthread rwlockattr t 结构 ， 用 pthread_rwlockattr_destroy 反 初 始 化 该 结构 。 


#include <pthread.h> 


int pthread rwlockattr init(pthread rwlockattr t *attr); 


int pthread rwlockattr destroy(pthread rwlockattr t *attr); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 
读 写 锁 支 持 的 唯一 属性 是 进程 共享 属性 。 它 与 互 斥 量 的 进程 共享 属性 是 相同 的 。 就 像 互 斥 量 
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的 进程 共享 属性 一 样 ， 有 一 对 函数 用 于 读 取 和 设置 读 写 锁 的 进程 共享 属性 。 


#include <pthread.h> 


int pthread_rwlockattr_getpshared(const pthread_rwlockattr_t * 
restrict atr, 
int *restrict pshared); 


int pthread rwlockattr setpshared(pthread rwlockattr t ‘attr, 
int pshared) ; 


两 个 函数 的 返回 值 : FRH., 0; 各 则 ， 返 回 错误 编号 


虽然 POSIX 只 定义 了 一 个 读 号 锁 属 性 ,但 不 同 平台 的 实现 可 以 自由 地 定义 额外 的 、 非 标准 的 
属性 。 


12.4.3 条件 变量 属性 


Single UNIX Specification 目前 定义 了 条 件 变量 的 两 个 属性 : 进程 共享 属性 和 时 钟 属 性 。 与 其 
他 的 属性 对 象 一 样 ， 有 一 对 函数 用 于 初始 化 和 反 初 始 化 条 件 变量 属性 。 


#include <pthread.h> 





int pthread condattr init(pthread condattr t *attr); 
int pthread condattr destroy(pthread condattr t *attr); 
两 个 沙 数 的 返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错 误 编 号 


与 其 他 的 同步 属性 一 样 , 条件 变 量 支 持 进程 共享 属性 。 它 控制 着 条 件 变 量 是 可 以 被 单 进程 的 多 个 
线程 使 用 ， 还 是 可 以 被 多 进程 的 线程 使 用 。 要 获取 进程 共享 属性 的 当前 值 ， 可 以 用 pthread 
condattr getpshared 函数 。 设 置 该 值 可 以 用 Pthread_condattr_setpshared 函数 。 





#include <pthread.h> 


int pthread_condattr_getpshared(const pthread_condattr_t * 
restrict attr, 
int *restrict pshared); 


int pthread condattr setpshared(pthread condattr t *attr, 
int pshared) ; 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错 误 编号 


时 钟 属性 控制 计算 pthread_cond_timedwait 函数 的 超时 参数 (tsptr) 时 采用 的 是 哪个 时 钟 。 
合法 值 取 自 图 6-8 中 列 出 的 时 钟 ID。 可 以 使 用 pthread_condattr_getclock 函数 获取 可 被 用 于 
pthread cond timedwait K hke ID， 在 使 用 pthread cond timedwait 函数 前 需要 用 
pthread condattr t 对 象 对 条 件 变 量 进行 初始 化 。 可 以 用 pthread condattr setclock 函数 
对 时 钟 ID 进行 修改 。 


#include «pthread.h» 





int pthread condattr getclock(const pthread condattr t * 
restrict attr, 
clockid t *restrict clock id); 


int pthread condattr setclock(pthread condattr t *atfr, 
clockid t clock id); 


两 个 函数 的 返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 
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奇怪 的 是 ，Single UNIX Specification 并 没有 为 其 他 有 超时 等 待 函数 的 属性 对 象 定义 时 钟 属性 。 


12.4.4 ”屏障 属性 


屏障 也 有 属性 。 可 以 使 用 pthread barrierattr init 函数 对 屏障 属性 对 象 进行 初 始 化 ， 
用 pthread barrierattr destroy 消 数 对 屏障 属性 对 和 象 进行 反 初 始 化 。 


#include <pthread.h> 


int pthread barrierattr init(pthread barrierattr t *affr); 


int pthread barrierattr destroy(pthread barrierattr t *atír); 


两 个 函数 的 返回 值 ， 车 成 功 ， 返 回 0;， 和 否则， 返回 错误 编号 


目前 定义 的 屏障 属性 只 有 进程 共享 属性 ， 它 控制 着 屏障 是 可 以 被 多 进程 的 线程 使 用 ， 还 是 只 能 被 
初始 化 屏障 的 进程 内 的 多 线程 使 用 。 与 其 他 属性 对 象 一 样 ， 有 一 个 获取 属性 值 的 函数 Cpthread_ 
barrierattr_getpshared) 和 一 个 设置 属性 值 的 函数 (pthread barrierattr setpshared). 





#include <pthread.h> 


int pthread_barrierattr_getpshared(const pthread barrierattr t * 
restrict attr, 
int *restrict pshared) ; 


int pthread barrierattr setpshared(pthread barrierattr t *attr, 
int pshared) ; 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


进程 共享 属性 的 值 可 以 是 PTHREAD PROCESS SHARED (多 进程 中 的 多 个 线程 可 用 }， 也 可 
以 是 PTHREAD_PROCESS_PRIVATE 〈 只 有 初始 化 屏障 的 那个 进程 内 的 多 个 线程 可 用 )。 





12.5 ÆA 


10.6 节 讨论 了 可 重 入 函数 和 信和 号 处 理 程 序 。 线 程 在 遇 到 重 入 问题 时 与 信号 处 理 程 序 是 类 似 的 。 
在 这 两 种 情况 下 ， 多 个 控制 线程 在 相同 的 时 间 有 可 能 调用 相同 的 函数 。 

如 果 一 个 函数 在 相同 的 时 间 点 可 以 被 多 个 线程 安全 地 调用 ， 就 称 该 函数 是 线程 安全 的 。 在 Single 
UNIX Specification 中 定义 的 所 有 函数 中 ,除了 图 12-9 中 列 出 的 函数 ， 其 他 函数 都 保证 是 线程 安全 的 。 
另外 ，ctermid 和 tmpnam 函数 在 参数 传 入 空 指针 时 并 不 能 保证 是 线程 安全 的 。 类 似 了 地 ， 如 果 参 数 
mbstate t 传 入 的 是 空 指 针 ， 也 不 能 保证 wcrtomb 和 wcsrtombs 函数 是 线程 安全 的 。 

支持 线程 安全 函数 的 操作 系统 实现 会 在 <unistd.h> 中 定义 符号 _POSIX_THREAD_SAFE_ 
FUNCTIONS。 应 用 程序 也 可 以 在 sysconf KP SC THREAD SAFE FUNCTIONS 参数 在 
运行 时 检查 是 否 支持 线程 安全 函数 。 在 SUSv4 之 前 , 要 求 所 有 遵循 XSI 的 实现 都 必须 支持 线程 安 
全 函数 ， 但 是 在 SUSv4 中 ， 线 程 安全 函数 支持 这 个 需求 已 经 要 求 具体 实现 考虑 遵循 POSIX. 

操作 系统 实现 支持 线程 安全 函数 这 个 特性 时 ， 对 POSIX.1 中 的 一 些 非 线程 安全 函数 ， 它 会 提 

供 可 替代 的 线程 安全 版 本 。 图 12-10 列 出 了 这 些 函 数 的 线程 安全 版 本 。 这 些 函 数 的 命名 方式 与 它 
们 的 非 线程 安全 版 本 的 名 字 相 似 ， 只 不 过 在 名 字 最 后 加 了 _r， 表 了 明 这 些 版 本 是 可 重 入 的 。 很 多 函 
数 并 不 是 线程 安全 的 ， 因 为 它们 返回 的 数据 存放 在 静态 的 内 存 缓冲 区 中 。 通 过 修改 接口 ， 要 求 调 
用 者 自己 提供 缓冲 区 可 以 使 函数 变 为 线程 安全 。 


basename 
catgets 
crypt 

dbm clearerr 
dbm close 
dbm delete 
dbm error 
dbm fetch 
dbm firstkey 
dbm nextkey 
dbm open 

dbm store 
dirname 
dlerror 
drand48 
encrypt 
endgrent 
endpwent 
endutxent 


getchar unlocked 
getdate 

getenv 

getgrent 
getgrgid 
getgrnam 
gethostent 


getlogin 
getnetbyaddr 


getnetbyname 
getnetent 

getopt 
getprotobyname 
getprotobynumber 
getprotoent 
getpwent 
getpwnam 
getpwuid 
getservbyname 


getservent 
getutxent 
getutxid 
getutxline 
gmtime 
hcreate 
hdestroy 
hsearch 
inet ntoa 
164a 
lgamma 
lgammaf 
lgammal 
localeconv 
localtime 
lrand48 
mrand48 
nftw 

nl langinfo 
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putc unlocked 
putchar unlocked 
putenv 
pututxline 
rand 

readdir 
setenv 
setgrent 
setkey 
setpwent 
setutxent 
strerror 
strsignal 
strtok 
system 
ttyname 
unsetenv 
wcstombs 
wctomb 





getservbyport 


12-9 POSIX.1 中 不 能 保证 线程 安全 的 函数 


getc unlocked ptsname 


localtime r 
readdir r 


getgrgid r 
getgrnam r 
getlogin r 
getpwnam r 


strerror r 
strtok r 
ttyname r 


getpwuid r 


gmtime r 
12-10 替代 的 线程 安全 函数 
如 果 一 个 函数 对 多 个 线程 来 说 是 可 重 入 的 ， 就 说 这 个 函数 就 是 线程 安全 的 。 但 这 并 不 能 说 明 对 信 
号 处 理 程序 来 说 该 函数 也 是 可 重 入 的 。 如 果 函 数 对 异步 信号 处 理 程序 的 重 入 是 安全 的 ， 那么 就 可 以 说 限 
数 是 异步 信号 安全 的 。 我 们 在 10.6 节 中 讨论 可 重 入 函数 时 ， 图 10-4 中 的 函数 就 是 异步 信号 安全 沙 数 。 
除了 图 12-10 中 列 出 的 函数 ，POSIX.1 还 提供 了 以 线程 安全 的 方式 管理 FILE 对 象 的 方法 。 
可 以 使 用 flockfile 和 ftrylockfile 获取 给 定 FILE 对 象 关联 的 锁 。 这 个 锁 是 递归 的 : 当 
你 占有 这 把 锁 的 时 候 ， 还 是 可 以 再 次 获取 该 锁 ， 而 且 不 会 导致 死 锁 。 虽 然 这 种 锁 的 具体 实现 并 无 
规定 ， 但 要 求 所 有 操作 FILE 对 象 的 标准 VO 例 程 的 动作 行为 必须 看 起 来 就 像 它们 内 部 调用 了 
flockfile #l funlockfile. 





finclude <stdio.h> 


int ftrylockfile(FILE *fp); 


返回 值 ， 若 成 功 ， 返 回 0， 若 不 能 获取 锁 ， 返 回 非 0 数值 


void flockfile(FILE *fp); 





void funlockfile(FILE *fp); 


虽然 标准 的 VO 例 程 可 能 从 它们 各 自 的 内 部 数据 结构 的 角度 出 发 ， 是 以 线程 安全 的 方式 实现 的 ， 
但 有 时 把 锁 开 放 给 应 用 程序 也 是 非常 有 用 的 。 这 允许 应 用 程序 把 多 个 对 标准 VO 函数 的 调用 组 合成 原 
子 序列 。 当 然 ， 在 处 理 多 个 PILE 对 象 时 ， 需 要 注意 潜在 的 死 锁 ， 需 要 对 所 有 的 锁 仔 细 地 排序 。 
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如 果 标 准 VO 例 程 都 获取 它们 各 自 的 锁 ， 那 么 在 做 一 次 一 个 字符 的 IO 时 就 会 出 现 严 重 的 性 
能 下 降 。 在 这 种 情况 下 ， 需 要 对 每 一 个 字符 的 读 写 操作 进行 获取 锁 和 释放 锁 的 动作 。 为 了 避免 这 


种 开销 ， 出 现 了 不 加 锁 版 本 的 基于 字符 的 标准 VO 例 程 。 


#include <stdio.h> 
int getchar_unlocked (void); 


int getc_unlocked (FILE *fp); 


两 个 函数 的 返回 值 : 车 成 功 ， 返 回 下 一 个 字符 ， 若 遇 到 文件 尾 或 者 出 错 ， 返 回 EOF 


int putchar unlocked(int c); 


int putc unlocked(int c, FILE *fp); 





两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 ce， 若 出 错 ， 返 回 EOF 


除非 被 flockfile (BE ftrylockfile) 和 funlockfile 的 调用 包围 ， 否 则 尽量 不 要 调用 这 
4 个 函数 , 因为 它们 会 导致 不 可 预期 的 结果 (比如 , 由 于 多 个 控制 线程 非 同步 访问 数据 引起 的 种 种 问题 )。 

一 旦 对 FILE 对 象 进行 加 锁 ， 就 可 以 在 释放 锁 之 前 对 这 些 函 数 进行 多 次 调用 。 这 样 就 可 以 在 
多 次 的 数据 读 写 上 分 摊 总 的 加 解锁 的 开销 。 


6 实例 
图 12-11 显示 了 getenv (47.9 节 ) 的 一 个 可 能 实现 。 这 个 版 本 不 是 可 重 入 的 。 如 果 两 个 线 


程 同 时 调用 这 个 函数 ， 就 会 看 到 不 一 致 的 结果 ， 因 为 所 有 调用 getenv 的 线程 返回 的 字符 串 都 存 
储 在 同一 个 静态 缓冲 区 中 。 


#include <Limits.h> 
#include <string.h> 


#define MAXSTRINGSZ 4096 
static char envbuf [MAXSTRINGSZ]; 
extern char **environ; 

char * 

getenv(const char *name) 

{ 


int i, len; 


len = strlen (name); 


for (i = 0; environ[i] != NULL; i++) ( 
if ((strnemp(name, environ[i], len) == 0) && 
(environ[i][len] == 's')) { 


strncpy(envbuf, &environf[il[len*1], MAXSTRINGSZ-1); 
return (envbuf); 
} 
} 
return (NULL) ; 


图 12-11 getenv 的 非 可 重 入 版 本 
图 12-12 给 出 了 getenv 的 可 重 入 的 版 本 。 这 个 版 本 叫做 getenv_r。 它 使 用 pthread_once 
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函数 来 确保 不 管 多 少 线程 同时 竞争 调用 getenv_r， 每 个 进程 只 调用 thread init 函数 一 次 。 
12.6 节 会 详细 描述 pthread_once MA. 


#include <string.h> 
include «errno.h» 
#include <pthread.h> 
#include <stdlib.h> 





extern char **environ; 
pthread mutex t env mutex; 
static pthread once t init done = PTHREAD ONCE INIT; 


static void 
thread init (void) 
( 
pthread mutexattr t attr; 


pthread mutexattr init(&attr); 

pthread mutexattr settype(&attr, PTHREAD MUTEX RECURSIVE); 
pthread mutex init(&env mutex, &attr); 

pthread mutexattr destroy(&attr); 


— 


int 
getenv r(const char *name, char *buf, int buflen) 


{ 


int i, len, olen; 


pthread_once (&init_done, thread init); 
len = strlen (name} ; 
pthread mutex lock(&env mutex); 
for (i = 0; environ[i] != NULL; i++) ( 
if ((strncmp(name, environ[i], len) == 0) && 
(environ[i][len] == '-')) I 
olen = strlen(&environ[i][len-1]); 
if (olen >= buflen) { 
pthread_mutex_unlock (&env_mutex) ; 
return (ENOSPC) ; 
} 
strcpy (buf, s&environ[i] [len+1]}; 
pthread mutex unlock(&env mutex); 
return(0); 
} 
} 
pthread mutex unlock(&env mutex); 
return (ENOENT) ; 


12-12 getenv 的 可 重 入 线程 安全 ) 版 本 
要 使 getenv_r 可 重 入 ， 需 要 改变 接口 ， 调 用 者 必须 提供 它 自己 的 缓冲 区 ， 这 样 每 个 线程 可 
以 使 用 各 自 不 同 的 缓冲 区 避免 其 他 线程 的 干扰 . 但 是 , 注意 , 要 想 使 getenv_r 成 为 线程 安全 的 ， 
这 样 做 还 不 够 ， 需 要 在 搜索 请 求 的 字符 时 保护 环境 不 被 修改 。 可 以 使 用 互 斥 量 ， 通 过 getenv_r 
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和 putenv 函数 对 环境 列表 的 访问 进行 串 行 化 。 

可 以 使 用 读 写 锁 ， 从 而 允许 对 getenv_r 进行 多 次 并 发 访问 ， 但 增加 的 并 发 性 可 能 并 不 会 在 
很 大 程度 上 改善 程序 的 性 能 ， 这 里 面 有 两 个 原因 ， 第 一 ， 环 境 列表 通常 并 不 会 很 长 ， 所 以 扫描 列 
表 时 并 不 需要 长 时 间 地 占有 互 斥 量 ; 第 二 ,对 getenv 和 putenv 的 调用 也 不 是 频繁 发 生 的 ， 所 
以 改善 它们 的 性 能 并 不 会 对 程序 的 整体 性 能 产生 很 大 的 影响 。 

即使 可 以 把 getenv r 变 成 线程 安全 的 ， 这 也 不 意味 着 它 对 信和 号 处 理 程序 是 可 重 入 的 。 如 果 使 用 
的 是 非 递归 的 互 斥 量 ， 线 程 从 信和 号 处 理 程序 中 调用 getenv r 就 有 可 能 出 现 死 锁 。 如 果 信 和 号 处 理 程序 
在 线程 执行 getenv_r 时 中 斯 了 该 线程 ， 这 时 我 们 已 经 占有 加 锁 的 env_mutex， 这 样 其 他 线程 试图 对 
这 个 互 斥 量 的 加 锁 就 会 被 阻塞 ， 最 终 导 致 线程 进入 死 锁 状 态 。 所 以 ， 必 须 使 用 递归 互 斥 量 阻 止 其 他 线程 
改变 我 们 正 需要 的 数据 结构 ， 还 要 阻止 来 自信 号 处 理 程序 的 死 锁 。 问 题 是 pthread 函数 并 不 保证 是 异步 
信号 安全 的 ， 所 以 不 能 把 pthread 函数 用 于 其 他 函数 ， 让 该 函数 成 为 虱 步 信号 安全 的 。 " 


12.6 ”线程 特定 数据 


线程 特定 数据 (thread-specific data)， 也 称 为 线程 私有 数据 (thread-private data)， 是 存储 和 查 
询 某 个 特定 线程 相关 数据 的 一 种 机 制 。 我 们 把 这 种 数据 称 为 线程 特定 数据 或 线程 私有 数据 的 原因 
是 , 我 们 希望 每 个 线程 可 以 访问 它 自己 单独 的 数据 副本 , 而 不 需要 担心 与 其 他 线程 的 同步 访问 问题 。 

线程 模型 促进 了 进程 中 数据 和 属性 的 共享 ， 许 多 人 在 设计 线程 模型 时 会 遇 到 各 种 麻烦 。 那 么 
为 什么 有 人 想 在 这 样 的 模型 中 促进 阻止 共享 的 接口 呢 ? 这 其 中 有 两 个 原因 。 

第 一 ， 有 时 候 需 要 维护 基于 每 线程 (per-thread). 的 数据 。 因 为 线程 ID 并 不 能 保证 是 小 而 连续 的 整 
数 ， 所 以 就 不 能 简单 地 分 配 一 个 每 线程 数据 数组 ,用 线程 D 作为 数组 的 索引 。 即 使 线程 ID 确实 是 小 而 
连续 的 整数 ， 我 们 可 能 还 希望 有 一 些 额 外 的 保护 ， 防 止 某 个 线程 的 数据 与 其 他 线程 的 数据 相 混 消 。 

采用 线程 私有 数据 的 第 二 个 原因 是 ， 它 提供 了 让 基于 进程 的 接口 适应 多 线程 环境 的 机 制 。 一 
个 很 明显 的 实例 就 是 errno, FIZ 1.7 TPM errno 的 讨论 。 以 前 的 接口 〈 线 程 出 现 以 前 ) 把 
errno 定义 为 进程 上 下 文中 全 局 可 访问 的 整数 。 系 统 调用 和 库 例 程 在 调用 或 执行 失败 时 设置 
errno， 把 它 作为 操作 失败 时 的 附属 结果 。 为 了 让 线程 也 能 够 使 用 那些 原本 基于 进程 的 系统 调用 
和 库 例 程 ，errno 被 重新 定义 为 线程 私有 数据 。 这 样 ， 一 个 线程 做 了 重 置 errno 的 操作 也 不 会 
影响 进程 中 其 他 线程 的 errno 值 。 

我 们 知道 一 个 进程 中 的 所 有 线程 都 可 以 访问 这 个 进程 的 整个 地 址 空间 。 除 了 使 用 寄存 器 以 
外 ， 一 个 线程 没有 办 法 阻止 另 一 个 线程 访问 它 的 数据 。 线 程 特定 数据 也 不 例外 。 明 然 底层 的 实现 
部 分 并 不 能 阻止 这 种 访问 能 力 ， 但 管理 线程 特定 数据 的 函数 可 以 提高 线程 间 的 数据 独立 性 ， 使 得 
线程 不 太 容 易 访 问 到 其 他 线程 的 线程 特定 数据 。 

在 分 配 线程 特定 数据 之 前 ， 需 要 创建 与 该 数据 关联 的 键 。 这 个 键 将 用 于 获取 对 线程 特定 数据 
Mi lel. EA pthread_key create 创建 一 个 键 。 


#include <pthread.nh> 


int pthread_key_create(pthread_key_t *keyp, void (*destructor) (void *)); 
返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 





创建 的 键 存 储 在 keyp 指向 的 内 存单 元 中 , 这 个 键 可 以 被 进程 中 的 所 有 线程 使 用 , 但 每 个 线程 ^ 
把 这 个 键 与 不 同 的 线程 特定 数据 地 址 进行 关联 。 创 建新 键 时 ， 每 个 线程 的 数据 地 址 设 为 空 值 。 
除了 创建 键 以 外 ，pthread_key_create 可 以 为 该 键 关 联 一 个 可 选择 的 析 构 函数 。 当 这 个 
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线程 退出 时 ， 如 果 数 据 地 址 已 经 被 置 为 非 空 值 ， 那 么 析 构 函数 就 会 被 调用 ， 它 唯一 的 参数 就 是 该 
数据 地 址 。 如 果 传 入 的 析 构 函数 为 空 ， 就 表明 没有 析 构 函数 与 这 个 键 关 联 。 当 线程 调用 
pthread exit 或 者 线程 执行 返回 ， 正常 退 出 时 ， 析 构 函 数 就 会 被 调用 。 同 样 ， 线 程 取消 时 ， 只 
有 在 最 后 的 清理 处 理 程序 返回 之 后 , 析 构 函数 才 会 被 调用 。 如果 线程 调用 了 exit. exit. Exit 
或 abort, 或 者 出 现 其 他 非 正 常 的 退出 时 ， 就 不 会 调用 析 构 函数 。 

线程 通常 使 用 malloc 为 线程 特定 数据 分 配 内 存 。 析 构 函 数 通 常 释 放 已 分 配 的 内 存 。 如 果 线 
程 在 没有 释放 内 存 之 前 就 退出 了 ， 那 么 这 块 内 存 就 会 丢失 ， 即 线程 所 属 进程 就 出 现 了 内 存 泄漏 。 

线程 可 以 为 线程 特定 数据 分 配 多 个 键 ， 每 个 键 都 可 以 有 一 个 析 构 函数 与 它 关 联 。 每 个 键 的 析 
构 函 数 可 以 互 不 相同 ， 当 然 所 有 键 也 可 以 使 用 相同 的 析 构 函数 。 每 个 操作 系统 实现 可 以 对 进程 可 
分 配 的 键 的 数量 进行 限制 (回忆 一 下 图 12-1 中 的 PTHREAD_KEYS MAX). 

线程 退出 时 ， 线 程 特定 数据 的 析 构 函数 将 按照 操作 系统 实现 中 定义 的 顺序 被 调用 。 析 构 函 数 
可 能 会 调用 另 一 个 函数 ， 该 函数 可 能 会 创建 新 的 线程 特定 数据 ， 并 且 把 这 个 数据 与 当前 的 键 关联 起 
来 。 当 所 有 的 析 构 函数 都 调用 完成 以 后 ， 系 统 会 检查 是 否 还 有 非 空 的 线程 特定 数据 值 与 键 关 联 ， 如 
果 有 的 话 ， 再 次 调用 析 构 函数 。 这 个 过 程 将 会 一 直 重 复 直 到 线程 所 有 的 键 都 为 空 线程 特定 数据 值 ， 
或 者 已 经 做 了 PTHREAD_DESTRUCTOR_ITERATIONS (JL 12-1) 中 定义 的 最 大 次 数 的 尝试 。 

对 所 有 的 线程 ， 我 们 都 可 以 通过 调用 pthread key delete 来 取消 键 与 线程 特定 数据 值 之 
间 的 关联 关系 。 447 


#include <pthread.h> 
int pthread_key_delete(pthread_key_t key); 





返回 值 : ARH. EO; 否则， 返回 错误 编号 


注意 ， 调 用 pthread key delete 并 不 会 激活 与 键 关 联 的 析 构 函数 。 要 释放 任何 与 键 关 联 
的 线程 特定 数据 值 的 内 存 ， 需 要 在 应 用 程序 中 采取 额外 的 步骤 。 

需要 确保 分 配 的 键 并 不 会 由 于 在 初始 化 阶段 的 竞争 而 发 生变 动 。 下 面 的 代码 会 导致 两 个 线程 
都 调用 pthread_ key create. 


void destructor(void *); 


pthread key t key; 
int init done - 0; 


int 
threadfunc(void *arg) 
{ 
if (linit done) { 
init done = 1; 
err = pthread key create(&key, destructor); 


) 
有 些 线程 可 能 看 到 一 个 键 值 ， 而 其 他 的 线程 看 到 的 可 能 是 另 一 个 不 同 的 键 值 ， 这 取决 于 系统 是 如 
何 调度 线程 的 ， 解 决 这 种 竞争 的 办 法 是 使 用 Pthread_once。 


#include <pthread.h> 
pthread_once_t initflag = PTHREAD_ONCE_INIT; 
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int pthread once(pthread once t ‘*initflag, void (*initfn) (void)): 





BA: 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


initflag 必须 是 一 个 非 本 地 变量 〈 如 全 局 变量 或 静态 变量 )， 而 且 必 须 初 始 化 为 PTHREAD_ 
ONCE, INIT. 

如 果 每 个 线程 都 调用 pthread_once， 系 统 就 能 保证 初始 化 例 程 initfn 只 被 调用 一 次 ， 即 系 
统 首次 调用 pthread_once 时 。 创 建 键 时 避免 出 现 冲 突 的 一 个 正确 方法 如 下 : 


void destructor (void *); 


pthread key t key; 
pthread once t init done - PTHREAD ONCE INIT; 
void 
thread init (void) 
{ 

err = pthread key create(&key, destructor); 
】 


int 
threadfunc(void *arg) 
{ 
pthread_once (Sinit_done, thread init); 


} 


键 一 旦 创建 以 后 ， 就 可 以 通过 调用 pthread_setspecific 函数 把 键 和 线程 特定 数据 关联 
起 来 。 可 以 通过 pthread_getspecific 函数 获得 线程 特定 数据 的 地 址 。 


#include «pthread.h» 


void *pthread getspecific(pthread key t key); 
返回 值 ， 线 程 特定 数据 值 ， 若 没有 值 与 该 键 关 联 ， 返 回 NULL 


int pthread setspecific(pthread key t key, const void *value): 


返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


如 果 没 有 线程 特定 数据 值 与 键 关 联 , pthread_getspecific 将 返回 一 个 空 指针 , 我 们 可 
以 用 这 个 返回 值 来 确定 是 否 需 要 调用 pthread setspecific. 





^u Schi 


图 12-11 给 出 了 getenv 的 假设 实现 。 接 着 又 给 出 了 一 个 新 的 接口 ， 提 供 的 功能 相同 ， 不 过 
它 是 线程 安全 的 ( 见 图 12-12)。 但 是 如 果 不 修改 应 用 程序 , 直接 使 用 新 的 接口 会 出 现 什么 问题 呢 ? 
这 种 情况 下 ， 可 以 使 用 线程 特定 数据 来 维护 每 个 线程 的 数据 缓冲 区 副本 ， 用 于 存放 各 自 的 返回 字 
符 串 ， 如 图 12-13 Pros. 
#include <limits.h> 
#include <string.h> 


#include <pthread.h> 
#include <stdlib.h> 


#define MAXSTRINGSZ 4096 
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static pthread key t key; 
Static pthread once t init done - PTHREAD ONCE INIT; 
pthread mutex t env mutex - PTHREAD MUTEX INITIALIZER; 


extern char **environ; 


Static void 
thread init (void) 
{ 
pthread key create(&key, free); 
} 


char * 
getenvíconst char *name) 
{ 
int i, len; 
char *envbuf; 


pthread once(&init done, thread init); 
pthread mutex lock(éenv mutex); 
envbuf = (char *)pthread getspecific(key); 
if (envbuf == NULL) { 
envbuf = malloc(MAXSTRINGSZ); 
if (envbuf == NULL) { 
pthread mutex unlock(&env mutex); 
return (NULL); 
} 
pthread_setspecific(key, envbuf); 
} 


len = strien(name); 


for (i = 0; environ[i] != NULL; i++) { 
if ({strncmp(name, environ[i], len) == 0) && 
{environ[i] [len] == '='}} ( 


strncpy(envbuf, &environ[i][len*1], MAXSTRINGSZ-1); 
pthread mutex unlock(&env mutex); 
return(envbuf); 
} 
} 
pthread mutex unlock(&env mutex); 
return (NULL); 





12-13 ”线程 安全 的 getenv 的 兼容 版 本 


我 们 使 用 pthread once 来 确保 只 为 我 们 将 使 用 的 线程 特定 数据 创建 一 个 键 。 如 果 
pthread getspecific 返回 的 是 空 指 针 ， 就 需要 先 分 配 内 存 缓冲 区 ， 然 后 再 把 键 与 该 内 存 组 
冲 区 关联 。 否 则 ， 如 果 返 回 的 不 是 空 指 针 ， 就 使 用 pthread_getspecific 返回 的 内 存 缓冲 区 。 

对 析 构 函数 ， 使 用 free 来 释放 之 前 由 malloc 分 配 的 内 存 。 只 有 当 线 程 特定 数据 值 为 非 空 时 ， 
析 构 函数 才 会 被 调用 。 

注意 ， 虽 然 这 个 版 本 的 getenv 是 线程 安全 的 , 但 它 并 不 是 异步 信号 安全 的 。 对 信号 处 理 程 
序 而 言 ， 即 使 使 用 递归 的 互 斥 量 ， 这 个 版 本 的 getenv 也 不 可 能 是 可 重 入 的 ， 因 为 它 调用 了 
malloc, 而 malloc 函数 本 身 并 不 是 异步 信号 安全 的 。 m [450 
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12.7 ”取消 选项 


有 两 个 线程 属性 并 没有 包含 在 pthread_attr_t 结构 中 , 它们 是 可 取消 状态 和 可 取消 类 型 。 
”这 两 个 属性 影响 着 线程 在 响应 pthread cancel 函数 调用 时 所 呈现 的 行为 ( 见 11.5 节 )。 
可 取消 状态 属性 可 以 是 PTHREAD CANCEL ENABLE， 也 可 以 是 PTHREAD CANCEL DISABLE. 
线程 可 以 通过 调用 pthread_setcancelstate 修改 它 的 可 取消 状态 。 


#include <pthread.h> 


int pthread setcancelstate(int state, int *oidstate); 





返回 值 : 车 成 功 ， 返 回 0， 否则， 返回 错误 编号 


pthread setcancelstate 把 当前 的 可 取消 状态 设置 为 state， 把 原来 的 可 取消 状态 存储 在 由 
oldstate 指向 的 内 存单 元 ， 这 两 步 是 一 个 原子 操作 。 

回忆 11.5 节 ，Pthread_cancel 调用 并 不 等 待 线程 终止 。 在 默认 情况 下 ， 线 程 在 取消 请 求 发 出 
以 后 还 是 继续 运行 ， 直 到 线程 到 达 某 个 取消 点 。 取 消 点 是 线程 检查 它 是 否 被 取消 的 一 个 位 置 ， 如 果 取 
消 了 ， 则 按照 请 求 行事 。POSIX.1 保证 在 线程 调用 图 12-14 中 列 出 的 任何 函数 时 ， 取 消 点 都 会 出 现 。 


accept mq timedsend pthread join sendto 

aio suspend msgrcv pthread testcancel sigsuspend 
Clock nanosleep msgsnd pwrite sigtimedwait 
close msync read sigwait 
connect nanosleep readv sigwaitinfo 
creat open recv sleep 


fcnti openat recvfrom system 
fdatasync pause recvmsg tcdrain 
fsync poll select wait 
lockf pread sem timedwait waitid 
mq receive pselect sem wait waitpid 
mq send pthread cond timedwait send write 
mq timedreceive pthread cond wait sendmsg writev 





12-14 POSIX.1 定义 的 取消 点 
线程 启动 时 默认 的 可 取消 状态 是 PTHREAD CANCEL ENABLE。 当 状态 设 为 PTHREAD_ 
CANCEL. DISABLE Af, 对 pthread_cancel 的 调用 并 不 会 杀 死 线程 。 相 反 ， 取消 请 求 对 这 个 线 
程 来 说 还 处 于 挂 起 状态 ， 当 取消 状态 再 次 变 为 PTHREAD CANCEL ENABLE 时 ， 线 程 将 在 下 一 个 
取消 点 上 对 所 有 挂 起 的 取消 请 求 进行 处 理 。 
451 除了 图 12-14 中 列 出 的 函数 ，POSIX.1 还 指定 了 图 12-15 中 列 出 的 函数 作为 可 选 的 取消 点 。 
图 12-15 中 列 出 的 有 些 函 数 并 没有 在 本 书 中 进一步 讨论 ， 例如， 处 理 消息 分 类 和 宽 字符 集 的 函 教 。 


如 果 应 用 程序 在 很 长 的 一 段 时 间 内 都 不 会 调用 图 12-14 或 图 12-15 中 的 函数 〈 如 数学 计算 领 
域 的 应 用 程序 )， 那 么 你 可 以 调用 pthread testcancel 函数 在 程序 中 添加 自己 的 取消 点 。 


#include «pthread.h» 
void pthread testcancel (void); 
调用 pthread_testcancel 时 ， 如 果 有 某 个 取消 请 求 正 处 于 挂 起 状态 ， 而 且 取 消 并 没有 置 


为 无 效 ， 那 么 线程 就 会 被 取消 。 但 是 ， 如 果 取 消 被 置 为 无 效 ，Pthread_testcancel 调用 就 没 
有 任何 效果 了 。 


access 
catclose 
catgets 
catopen 
chmod 
chown 
closedir 
closelog 
ctermid 
dbm close 
dbm_delete 
dbm fetch 
dbm nextkey 
dbm open 
dbm store 
dlclose 
dlopen 
dprintf 
endgrent 
endhostent 
endnetent 
endprotoent 
endpwent 
endservent 
endutxent 
faccessat 
fchmod 
fchmodat 
fchown 
fchownat 
fclose 
fcntl 
fflush 
fgetc 
fgetpos 
fgets 
fgetwc 
fgetws 
fmtmsg 
fopen 
fpathconf 
fprintf 
fputc 
fputs 
fputwc 
fputws 
fread 
freopen 
fscanf 
fseek 


fseeko 
fsetpos 

fstat 

fstatat 

ftell 

ftello 
futimens 
fwprintf 
fwrite 
fwscanf 
getaddrinfo 
getc 

getc unlocked 
getchar 
getchar unlocked 
getcwd 
getdate 
getdelim 
getgrent 
getgrgid 
getgrgid r 
getgrnam 
getgrnam r 
gethostent 
gethostid 
gethostname 
getline 
getlogin 
getlogin r 
getnameinfo 
getnetbyaddr 
getnetbyname 
getnetent 
getopt 
getprotobyname 
getprotobynumber 
getprotoent 
getpwent 
getpwnam 
getpwnam r 
getpwuid 
getpwuid r 
getservbyname 
getservbyport 
getservent 
getutxent 
getutxid 
getutxline 
getwc 


getwchar 
glob 

iconv close 
iconv open 
ioctl 

link 

linkat 

lio listio 
localtime 
localtime r 
lockf 

lseek 

lstat 

mkdir 
mkdirat 
mkdtemp 
mkfifo 
mkfifoat 
mknod 
mknodat 
mkstemp 
mktime 

nftw 

opendir 
openlog 
pathconf 
pclose 
perror 

popen 

posix fadvise 
posix fallocate 
posix madvise 
posix openpt 
posix spawn 
posix spawnp 


posix typed mem open 


printf 
psiginfo 
psignal 


pthread rwlock rdlock 
pthread rwlock timedrdlock 
pthread rwlock timedwrlock 
pthread rwlock wrlock 


putc 

putc unlocked 
putchar 

putchar unlocked 
puts 

pututxline 
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putwc 
putwchar 
readdir 
readdir r 
readlink 
readlinkat 
remove 
rename 
renameat 
rewind 
rewinddir 
scandir 
scanf 
seekdir 
semop 
setgrent 
sethostent 
setnetent 
setprotoent 
setpwent 
setservent 
setutxent 
stat 
strerror 
strerror r 
strftime 
symlink 
symlinkat 
sync 
syslog 
tmpfile 
ttyname 
ttyname_r 
tzset 
ungetc 
ungetwc 
unlink 
unlinkat 
utimensat 
utimes 
vdprintf 
vfprintf 
vfwprintf 
vprintf 
vwprintf 
wcsftime 
wordexp 
wprintf 
wscanf 





12-15 POSIX.1 定义 的 可 选取 消 点 


我 们 所 描述 的 默认 的 取消 类 型 也 称 为 推迟 取消 。 调 用 pthread_cancel 以 后 ， 在 线程 到 达到 
消 点 之 前 ， 并 不 会 出 现 真 正 的 取消 。 可 以 通过 调用 pthread_setcanceltype 来 修改 取消 类 型 。 


#include <pthread.h> 


int pthread setcanceltype(int type, int *oldtype); 


返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 
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pthread setcanceltype 函数 把 取消 类 型 设置 为 ype( 类 型 参数 可 以 是 PTHREADCANCEL | 
DEFERRED, tH ATLAS PTHREAD CANCEL _ASYNCHRONOUS)， 把 原来 的 取消 类 型 返回 到 oldtype 
指向 的 整 型 单元 。 

异步 取消 与 推迟 取消 不 同 ， 因 为 使 用 异步 取消 时 ， 线 程 可 以 在 任意 时 间 撤 消 ， 不 是 非得 过 到 
取消 点 才能 被 取消 。 


12.8 线程 和 信号 


即使 是 在 基于 进程 的 编程 范 型 中 ， 信 和 号 的 处 理 有 时 候 也 是 很 复杂 的 。 把 线程 引入 编程 范 型 ， 
就 使 信号 的 处 理 变 得 更 加 复杂 。 

每 个 线程 都 有 自己 的 信号 屏蔽 字 ， 但 是 信号 的 处 理 是 进程 中 所 有 线程 共享 的 。 这 意味 着 单个 
线程 可 以 阻止 某 些 信号 ， 但 当 某 个 线程 修改 了 与 某 个 给 定 信和 号 相关 的 处 理 行为 以 后 ， 所 有 的 线程 
都 必须 共享 这 个 处 理 行为 的 改变 。 这 样 ， 如 果 一 个 线程 选择 忽略 某 个 给 定 信号 ， 那 么 另 一 个 线程 
就 可 以 通过 以 下 两 种 方式 撤消 上 述 线程 的 信号 选择 : 恢复 信和 号 的 默认 处 理 行为 ， 或 者 为 信号 设置 
一 个 新 的 信号 处 理 程序 。 

进程 中 的 信号 是 递送 到 单个 线程 的 。 如 果 一 个 信号 与 硬件 故障 相关 ， 那 么 该 信号 一 般 会 被 发 
送 到 引起 该 事件 的 线程 中 去 ， 而 其 他 的 信号 则 被 发 送 到 任意 一 个 线程 。 

10.12 节 讨 论 了 进程 如 何 使 用 sigprocmask 函数 来 阻止 信号 发 送 。 然 而 ，sigprocmask 

452| 的 行为 在 多 线程 的 进程 中 并 没有 定义 ， 线 程 必须 使 用 pthread_sigmask。 
#include <signal.h> 
int pthread sigmask(int how, const sigset t *restrict set, 


sigset t *restrict oset); 





返回 值 : 车 成 功 ， 返回 0: 否则 ， 返回 错误 编号 


pthread sigmask 函数 与 sigprocmask 函数 基本 相同 ， 不 过 pthread_sigmask 工作 
在 线程 中 ， 而 且 失 败 时 返回 错误 码 ， 不 再 像 sigprocmask 中 那样 设置 errno 并 返回 -1。set 参 
数 包含 线程 用 于 修改 信号 屏蔽 字 的 信号 集 。jphow 参数 可 以 取 下 列 3 个 值 之 一 : SIG_BLOCK， 把 信 
号 集 添 加 到 线程 信号 屏蔽 字 中 ，SIG_SETMASK ， 用 信号 集 替 换 线 程 的 信和 号 屏蔽 字 :; 
SIG_UNBLOCK， 从 线程 信号 屏蔽 字 中 移 除 信 号 集 。 如 果 oet 参数 不 为 宅 ， 线 程 之 前 的 信和 号 屏蔽 
字 就 存储 在 它 指向 的 sigset t 结构 中 。 线 程 可 以 通过 把 se 参数 设置 为 NULL， 并 把 oset 参数 
设置 为 sigset t 结构 的 地 址 ， 来 获取 当前 的 信号 屏蔽 字 。 这 种 情况 中 的 how 参数 会 被 忽略 。 

线程 可 以 通过 调用 sigwait 等 待 一 个 或 多 个 信号 的 出 现 。 





set 参数 指定 了 线程 等 待 的 信号 集 。 返 回 时 ，signop 指向 的 整数 将 包含 发 送信 号 的 数量 。 

如 果 信 号 集中 的 某 个 信号 在 sigwait 调用 的 时 候 处 于 挂 起 状态 ,那么 sigwait 将 无 阻塞 地 返回 。 
在 返回 之 前 ，sigwait 将 从 进程 中 移 除 那 些 处 于 挂 起 等 待 状态 的 信号 。 如 果 具 体 实现 支持 排队 信和 号 ， 
并 且 信 和 号 的 多 个 实例 被 挂 起 ， 那 么 sigwait 将 会 移 除 该 信号 的 一 个 实例 ， 其 他 的 实例 还 要 继续 排队 。 

为 了 避免 错误 行为 发 生 ， 线 程 在 调用 sigwait 之 前 ， 必 须 阻塞 那些 它 正在 等 待 的 信号 。 
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sigwait 函数 会 原子 地 取消 信和 号 集 的 阻塞 状态 , 直到 有 新 的 信号 被 递送 。 在 返回 之 前 , sigwait 
将 恢复 线程 的 信号 屏蔽 字 。 如 果 信 号 在 sigwait 被 调用 的 时 候 没 有 被 阻塞 ， 那 么 在 线程 完成 对 
sigwait 的 调用 之 前 会 出 现 一 个 时 间 窗 ， 在 这 个 时 间 窗 中 ， 信 号 就 可 以 被 发 送 给 线程 。 

使 用 sigwait 的 好 处 在 于 它 可 以 简化 信号 处 理 ， 允 许 把 异步 产生 的 信号 用 同步 的 方式 处 理 。 
为 了 防止 信号 中 断 线程 ， 可 以 把 信号 加 到 每 个 线程 的 信和 号 屏蔽 字 中 。 然 后 可 以 安排 专用 线程 处 理 
信号 。 这 些 专 用 线程 可 以 进行 函数 调用 ， 不 需要 担心 在 信号 处 理 程序 中 调用 哪些 函数 是 安全 的 ， 
因为 这 些 函 数 调 用 来 自 正常 的 线程 上 下 文 ， 而 非 会 中 断 线 程 正常 执行 的 传统 信号 处 理 程序 。 

如 果 多 个 线程 在 sigwait 的 调用 中 因 等 待 同一 个 信号 而 阻塞 ， 那 么 在 信和 号 递送 的 时 候 ， 就 
只 有 一 个 线程 可 以 从 sigwait 中 返回 。 如 果 一 个 信和 号 被 捕获 〈 例 如 进程 通过 使 用 sigaction 
建立 了 一 个 信号 处 理 程序 )， 而 且 一 个 线程 正在 sigwait 调用 中 等 待 同一 信号 ， 那 么 这 时 将 由 操 
作 系统 实现 来 决定 以 何 种 方式 递送 信号 。 操 作 系统 实现 可 以 让 sigwait 返回 ， 也 可 以 激活 信号 
处 理 程序 ， 但 这 两 种 情况 不 会 同时 发 生 。 

要 把 信号 发 送 给 进程 ,可 以 调用 kill ( 见 10.9 节 )。 要 把 信和 号 发 送 给 线程 ,可 以 调用 pthread_ 
kill. 
finclude «signal.h» 


int pthread kill(pthread t thread, int signo); 





可 以 传 一 个 0 值 的 signo 来 检查 线程 是 否 存 在 。 如 果 信和 号 的 默认 处 理 动 作 是 终止 该 进程 ， 那 
么 把 信号 传递 给 某 个 线程 仍然 会 杀 死 整个 进程 。 

注意 ， 闵 钟 定 时 器 是 进程 资源 ， 并 且 所 有 的 线程 共享 相同 的 闹钟 。 所 以 ， 进 程 中 的 多 个 线程 
不 可 能 互 不 干扰 〈 或 互 不 合作 〉 地 使 用 疮 钟 定时 器 (这 是 习题 12.6 的 内 容 )。 


^w 实例 

回忆 图 10-23 所 示 的 程序 ， 我 们 等 待 信号 处 理 程序 设置 标志 表明 主 程序 应 该 退出 。 唯 一 可 运 
行 的 控制 线程 就 是 主线 程 和 信号 处 理 程序 ， 所 以 阻塞 信号 足以 避免 错失 标志 修改 。 在 线程 中 ， 我 
们 需要 使 用 互 斥 量 来 保护 标志 ， 如 图 12-16 中 的 程序 所 示 。 


finclude "apue.h" 
#include <pthread.h> 


int quitflag; /* set nonzero by thread */ 
sigset_t mask; 


pthread mutex t lock = PTHREAD MUTEX INITIALIZER; 
pthread cond t waitloc - PTHREAD COND INITIALIZER; 


void * 
thr_fn(void *arg) 
{ 


int err, signo; 


for (77) 1 
err = sigwait(&mask, &signo); 
if (err != 0) 
err exit(err, "sigwait failed"); 
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switch (signo) { 
case SIGINT: 
printf ("\ninterrupt\n"); 
break; 


case SIGQUIT: 
pthread mutex lock(&lock); 
quitflag = 1; 
pthread mutex unlock(&lock); 
pthread cond signal (&waitloc); 
return(í0); 


default: 
printf ("unexpected signal %d\n", signo): 
exit(1); 


int 
main (void) 


{ 


int err; 
sigset_t oldmask; 
pthread_t tid; 


sigemptyset (&mask); 

sigaddset(&mask, SIGINT); 

sigaddset(&mask, SIGQUIT); 

if ((err = pthread sigmask(SIG BLOCK, &mask, &oldmask)) != 0) 
err exit(err, "SIG BLOCK error"); 


err = pthread create(&tid, NULL, thr fn, 0); 
if (err != 0) 
err exit(err, "can't create thread"); 


pthread_mutex_lock (&lock); 

while (quitflag == 0) 
pthread cond wait(&waitloc, &lock); 

pthread mutex unlock(&lock); 


/* SIGQUIT has been caught and is now blocked; do whatever */ 
quitflag - 0; 


/* reset signal mask which unblocks SIGQUIT */ 

if (sigprocmask(SIG SETMASK, &oldmask, NULL) < 0) 
err Sys("SIG SETMASK error"); 

exit (0); 


图 12-16 同步 信号 处 理 
我 们 不 用 依赖 信号 处 理 程序 中 断 主 控 线程 有 专门 的 独立 控制 线程 进行 信号 处 理 。 在 互 斥 量 的 
保护 下 改动 quitflag 的 值 , 这样 主 控 线程 不 会 在 调用 pthread_cond_signal 时 错失 唤醒 调用 。 
在 主 控 线 程 中 使 用 相同 的 互 斥 量 来 检查 标志 的 值 ， 并 且 原 子 地 释放 互 斥 量 ， 等 待 条 件 的 发 生 。 
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注意 ， 在 主线 程 开始 时 阻塞 SIGINT 和 SITGQUIT。 当 创建 线程 进行 信号 处 理 时 ， 新 建 线程 
继承 了 现 有 的 信号 屏 项 字 。 因 为 sigwait 会 解除 信号 的 阻塞 状态 ， 所 有 只 有 一 个 线程 可 以 用 于 
信和 兄 的 接收 。 这 可 以 使 我 们 对 主线 程 进行 编码 时 不 必 担 心 来 自 这 些 信 号 的 中 断 。 

运行 这 个 程序 可 以 得 到 与 图 10-23 类 似 的 输出 结果 : 


$ ./a.out 


^? 输入 中 断 字 符 

interrupt 

^? 青 次 输入 中 断 字 符 

interrupt 

^p 再 次 输入 中 断 字符 

interrupt 

^$ 现在 用 退出 符 终止 e 


12.9 EF fork 


当 线 程 调用 fork 时 ， 就 为 子 进程 创建 了 整个 进程 地 址 空间 的 副本 。 回 忆 8.3 节 中 讨论 的 写 
时 复制 ， 子 进程 与 父 进程 是 完全 不 同 的 进程 ， 只 要 两 者 都 没有 对 内 存 内 容 做 出 改动 ， 父 进程 和 子 
进程 之 间 还 可 以 共享 内 存 页 的 副本 。 

子 进程 通过 继承 整个 地 址 空间 的 副本 ， 还 从 父 进 程 那 儿 继承 了 每 个 互 斥 量 、 读 写 锁 和 条 件 变 
量 的 状态 。 如 果 父 进程 包含 一 个 以 上 的 线程 ， 子 进程 在 fork 返回 以 后 ， 如 果 紧 接着 不 是 马上 调 
用 exec 的 话 ， 就 需要 清理 锁 状 态 。 

在 子 进程 内 部 ， 只 存在 一 个 线程 ， 它 是 由 父 进 程 中 调用 fork 的 线程 的 副本 构成 的 。 如 果 父 
进程 中 的 线程 占有 锁 ， 子 进程 将 同样 占有 这 些 锁 。 问 题 是 子 进程 并 不 包含 占有 锁 的 线程 的 副本 ， 
所 以 子 进程 没有 办 法 知道 它 占有 了 哪些 锁 、 需 要 释放 哪些 锁 。 

如 果子 进程 从 fork 返回 以 后 马上 调用 其 中 一 个 exec 函数 ， 就 可 以 避免 这 样 的 问题 。 这 种 
情况 下 ， 旧 的 地 址 空间 就 被 丢弃 ， 所 以 锁 的 状态 无 关 紧 要 。 但 如 果子 进程 需要 继续 做 处 理工 作 的 
话 ， 这 种 策略 就 行 不 通 ， 还 需要 使 用 其 他 的 策略 。 

在 多 线程 的 进程 中 ， 为 了 避免 不 一 致 状态 的 问题 ，POSIX.1 声明 ， 在 fork 返回 和 子 进程 调 
用 其 中 一 个 exec 函数 之 间 ， 子 进程 只 能 调用 异步 信号 安全 的 函数 。 这 就 限制 了 在 调用 exec 之 
前 子 进程 能 做 什么 ， 但 不 涉及 子 进程 中 锁 状 态 的 问题 。 

要 清除 锁 状 态 ， 可 以 通过 调用 pthread_atfork 函数 建立 fork 处 理 程序 。 


#include <pthread.h> 


int pthread_atfork(void (*prepare) (void), void (*parent) (void), 


void (*child) (void)): 





返回 值 : 车 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


用 pthread atfork 国 数 最 多 可 以 安装 3 个 帮助 清理 锁 的 消 数 。prepare fork 处 理 程 序 由 父 进程 
在 fork 创建 子 进程 前 调用 。 这 个 fork 处 理 程序 的 任务 是 获取 父 进 程 定义 的 所 有 锁 。jparent fork 处 理 
程序 是 在 fork 创建 子 进程 以 后 、 返 回 之 前 在 父 进程 上 下 文中 调用 的 。 这 个 fork 处 理 程序 的 任务 是 对 
prepare fork 处 理 程序 获取 的 所 有 锁 进 行 解锁 。cAiiwy fork 处 理 程序 在 fork 返回 之 前 在 子 进程 上 下 文中 
调用 。 与 parent fork 处 理 程序 一 样 ，cpia fork 处 理 程序 也 必须 释放 prepare fork 处 理 程 序 获取 的 所 有 锁 。 
注意 ， 不 会 出 现 加 锁 一 次 解锁 两 次 的 情况 ， 虽 然 看 起 来 也 许 会 出 现 。 子 进程 地 址 空间 在 创建 时 就 
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得 到 了 父 进 程 定义 的 所 有 锁 的 副本 。 因 为 prepare fork 处 理 程 序 获 取 了 所 有 的 锁 ， 父 进程 中 的 内 存 和 
子 进程 中 的 内 存 内 容 在 开始 的 时 候 是 相同 的 。 当 父 进程 和 子 进程 对 它们 锁 的 副本 进程 解锁 的 时 候 ， 新 
的 内 存 是 分 配给 子 进 程 的 ， 父 进 程 的 内 存 内 容 是 复制 到 子 进程 的 内 存 中 《〈 写 时 复制 )， 所 以 我 们 就 会 
陷入 这 样 的 假象 ， 看 起 来 父 进 程 对 它 所 有 的 锁 的 副本 进行 了 加 锁 ， 子 进程 对 它 所 有 的 锁 的 副本 进行 了 
加 锁 。 父 进程 和 子 进程 对 在 不 同 内 存单 元 的 重复 的 锁 都 进行 了 解锁 操作 ， 就 好 像 出 现 了 下 列 事 件 序列 。 

C1) 父 进 程 获取 所 有 的 锁 。 

(2) 子 进 程 获取 所 有 的 锁 。 

(3) 父 进程 释放 它 的 锁 。 

(4) 子 进程 释放 它 的 锁 。 

可 以 多 次 调用 pthread atfork 函数 从 而 设置 多 套 fork 处 理 程序 。 如 果 不 需 要 使 用 其 中 某 
个 处 理 程 序 ， 可 以 给 特定 的 处 理 程序 参数 传 入 空 指 针 ， 它 就 不 会 起 任何 作用 了 。 使 用 多 个 fork 处 
理 程 序 时 ， 处 理 程序 的 调用 顺序 并 不 相同 。parent 和 child fork 处 理 程序 是 以 它们 注册 时 的 顺序 进 
行 调用 的 ， 而 prepare fork 处 理 程序 的 调用 顺序 与 它们 注册 时 的 顺序 相反 。 这 样 可 以 允许 多 个 模 
块 注册 它们 自己 的 fork 处 理 程序 ， 而 且 可 以 保持 锁 的 层次 。 

例如 ， 假 设 模块 4 调用 模块 8 中 的 函数 ， 而 且 每 个 模块 有 自己 的 一 套 锁 。 如 果 锁 的 层次 是 4 
在 8 之 前 , 模块 B 必须 在 模块 4 之 前 设置 它 的 fork 处 理 程序 。 当 父 进程 调用 fork 时 ,就 会 执行 
以 下 的 步 又 ， 假 设 子 进程 在 父 进 程 之 前 运行 : 

CD 调用 模块 A 的 prepare fork 处 理 程序 获取 模块 4 的 所 有 锁 。 

(2) 调用 模块 B 的 prepare fork 处 理 程序 获取 模块 B 的 所 有 锁 。 

(3) 创建 子 进程 。 

(4) 调用 模块 B 中 的 child fork 处 理 程序 释放 子 进程 中 模块 B 的 所 有 锁 。 

(5) 调用 模块 4 中 的 child fork 处 理 程序 释放 子 进程 中 模块 4 的 所 有 锁 。 

(6) fork 函数 返回 到 子 进 程 。 

CD 调用 模块 B 中 的 parent fork 处 理 程序 释放 父 进程 中 模块 中 的 所 有 锁 。 

(8) 调用 模块 4 中 的 parent fork 处 理 程序 来 释放 父 进程 中 模块 4 的 所 有 锁 。 

(9) fork 函数 返回 到 父 进程 。 

如 果 fork 处 理 程序 是 用 来 清理 锁 状 态 的 ,那么 又 由 谁 来 负责 清理 条 件 变 量 的 状态 呢 ? 在 有 些 
操作 系统 的 实现 中 ， 条 件 变量 可 能 并 不 需要 做 任何 清理 。 但 是 有 些 操作 系统 实现 把 锁 作 为 条 件 变 
量 实现 的 一 部 分 , 这 种 情况 下 的 条 件 变 量 就 需要 清理 。 问题 是 目前 不 存在 允许 清理 锁 状 态 的 接口 。 
如 果 锁 是 内 入 到 条 件 变量 的 数据 结构 中 的 ， 那 么 在 调用 fork 之 后 就 不 能 使 用 条 件 变量 ， 因 为 还 
没有 可 移植 的 方法 对 锁 进 行 状 态 清理 。 另 外 ， 如 果 操 作 系 统 的 实现 是 使 用 全 局 锁 保 护 进程 中 所 有 
的 条 件 变量 数据 结构 ， 那 么 操作 系统 实现 本 身 可 以 在 fork 库 例 程 中 做 清理 锁 的 工作 ， 但 是 应 用 
程序 不 应 该 依赖 操作 系统 实现 中 类 似 这 样 的 细节 。 


时 实例 


图 12-17 中 的 程序 描述 了 如 何 使 用 Pthread_atfork 和 fork 处 理 程序 。 


#include "apue.h" 
#include <pthread.h> 


pthread_mutex_t lockl = PTHREAD_MUTEX_INITIALIZER; 
pthread mutex t lock2 = PTHREAD MUTEX INIT IALIZER; 





void 
prepare (void) 
( 


int err; 


printf("preparing locks...\n"); 


if ((err = pthread mutex lock(&lock1)) != 0) 
err cont(err, "can't lock lockl in prepare handler"); 
if ((err = pthread mutex lock(&lock2)) != 0) 


err cont(err, "can't lock lock2 in prepare handler"); 


void 
parent (void) 
{ 


int err; 


printf ("parent unlocking locks...\n"); 


if ((err = pthread_mutex_unlock(&lockl)) != 0} 
err cont(err, "can't unlock lockl in parent handler"); 
if ((err - pthread mutex unlock(&lock2)) !- 0) 


err cont(err, "can't unlock lock2 in parent handler"); 


void 
child (void) 
{ 


int err; 


printf ("child unlocking locks...\n"); 


if ((err = pthread mutex unlock(&lockl)) != 0) 
err cont(err, "can't unlock lockl in child handler"); 
if ((err = pthread mutex unlock(&lock2)) != 0) 


err cont(err, "can't unlock lock2 in child handler"); 


void * 

thr_fn(void *arg) 

{ 
printf("thread started...\n"); 
pause (); 
return (0); 


int 
main (void) 
{ 


int err; 
pid t pid; 
pthread t tid; 
if ((err = pthread atfork(prepare, parent, child)) !- 0} 


err exit(err, "can't install fork handlers"); 
if ((err = pthread create(&tid, NULL, thr fn, 0)} != 0) 
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err exit(err, "can't create thread"); 


sleep(2); 
printf ("parent about to fork...\n"); 


if ((pid = fork()) < 0) 
err quit("fork failed"); 
else if (pid == 0) /* child */ 
printf("child returned from forkMn"); 
else /* parent */ 
printf("parent returned from fork\n"); 
exit(0); 


图 12-17 pthread atfork 实例 


12-17 中 定义 了 两 个 互 斥 量 ，1ock1l1 和 lock2, prepare fork 处 理 程序 获取 这 两 把 锁 , child 
fork 处 理 程序 在 子 进程 上 下 文中 有 释放 它们 ，parent fork 处 理 程 序 在 父 进程 上 下 文中 释放 它们 。 
运行 该 程序 ， 得 到 如 下 输出 ; 


$ ./a.out 

thread started... 

parent about to fork... 
preparing locks... 

child unlocking locks... 
child returned from fork 
parent unlocking locks... 
parent returned from fork 


可 以 看 到 ，prepare fork 处 理 程序 在 调用 fork 以 后 运行 ，child fork 处 理 程序 在 fork 调用 返回 到 
子 进程 之 前 运行 ，parent fork 处 理 程序 在 fork 调用 返回 给 父 进 程 之 前 运行 。 x 


虽然 pthread atfork 机 制 的 意图 是 使 fork 之 后 的 锁 状 态 保持 一 致 ， 但 它 还 是 存在 一 些 
不 足 之 处 ， 只 能 在 有 限 情 况 下 可 用 。 

。 没有 很 好 的 办 法 对 较 复 杂 的 同步 对 象 〈 如 条 件 变量 或 者 屏障 ) 进行 状态 的 重新 初始 化 。 

。 某 些 错误 检查 的 互 斥 量 实现 在 child fork 处 理 程序 试图 对 被 父 进程 加 锁 的 互 斥 量 进行 解锁 
时 会 产生 错误 。 

。 递归 互 斥 量 不 能 在 child fork 处 理 程序 中 清理 , 因为 没有 办 法 确定 该 互 斥 量 被 加 锁 的 次 数 。 

。 如 果子 进程 只 允许 调用 异步 信号 安全 的 函数 ，cpid fork 处 理 程 序 就 不 可 能 清理 同步 对 象 ， 
因为 用 于 操作 清理 的 所 有 函数 都 不 是 蜡 步 信号 安全 的 。 实 际 的 问题 是 同步 对 象 在 某 个 线 
程 调用 fork 时 可 能 处 于 中 间 状 态 ， 除 非 同 步 对 象 处 于 一 致 状态 ， 否 则 无 法 被 清理 。 

。 如 果 应 用 程序 在 信号 处 理 程序 中 调用 了 fork (这 是 合法 的 ， 因 为 fork 本 身 是 异步 信号 安 
全 的 )，pthread_atfork 注册 的 fork 处 理 程序 只 能 调用 异步 信号 安全 的 函数 ， 和 否则 结 
果 将 是 未 定义 的 。 


12.10 ”线程 和 1/O 


3.11 节 介 绍 了 pread 和 pwrite 函数 。 这 些 函 数 在 多 线程 环境 下 是 非常 有 用 的 ， 因 为 进程 
中 的 所 有 线程 共享 相同 的 文件 撕 述 符 。 


习题 371 


考虑 两 个 线程 ， 在 同一 时 间 对 同一 个 文件 描述 符 进行 读 写 操 作 。 461 
线程 A 线程 B 
lseek(fd, 300, SEEK SET); lseek(fd, 700, SEEK, SET); 
read(fd, bufl, 100); read(fd, buf2, 100); 


如 果 线 程 A 执行 1seek 然后 线程 B 在 线程 A 调用 read 之 前 调用 lseek, 那么 两 个 线程 最 
终 会 读 取 同一 条 记录 。 很 显然 这 不 是 我 们 希望 的 。 
为 了 解决 这 个 问题 ， 可 以 使 用 pread， 使 偏 移 量 的 设 定 和 数据 的 读 取 成 为 一 个 原子 操作 。 


线程 A 线程 B 
pread(fd, bufl, 100, 300); pread(fd, buf2, 100, 700); 


使 用 pread 可 以 确保 线程 A 读 取 偏 移 量 为 300 的 记录 , 而 线程 B 读 取 偏 移 量 为 700 的 记录 。 
可 以 使 用 pwrite 来 解决 并 发 线程 对 同一 文件 进行 写 操作 的 问题 。 


12.11 小 结 


在 UNIX 系统 中 ， 线 程 提供 了 分 解 并 发 任务 的 另 一 种 模型 。 线 程 促进 了 独立 控制 线程 之 间 的 
共享 ， 但 也 出 现 了 它 特有 的 同步 问题 。 本 章 中 ， 我 们 了 解 了 如 何 调整 线程 和 它们 的 同步 原 语 ， 讨 
论 了 线程 的 可 重 入 性 ， 还 学 习 了 线程 如 何 与 其 他 面向 进程 的 系统 调用 进行 交互 。 


习题 


12.1 Æ Linux 系统 中 运行 图 12-17 中 的 程序 ， 但 把 输出 结果 重 定向 到 一 个 文件 中 ， 并 解释 结果 。 

12.2 实现 putenv r， 即 putenv 的 可 重 入 版 本 。 确 保 你 的 实现 既是 线程 安全 的 ， 也 是 异步 信 
号 安全 的 。 

123 是 否 可 以 通过 在 getenv 函数 开始 的 时 候 阻 塞 信号 ， 并 在 getenv 函数 返回 之 前 恢复 原来 
的 信号 屏蔽 字 这 种 方法 ， 让 图 12-13 中 的 getenv 函数 变 成 异步 信号 安全 的 ? 解释 其 原因 。 

124 写 一 个 程序 练习 图 12-13 中 的 getenv MA, TE FreeBSD 上 编译 并 运行 程序 ， 会 出 现 什么 
结果 ? 解释 其 原因 。 

12.5 假设 可 以 在 一 个 程序 中 创建 多 个 线程 执行 不 同 的 任务 ,为 什么 还 是 有 可 能 会 需要 用 fork? 
解释 其 原因 。 

12.6 重新 实现 图 10-29 中 的 程序 ， 在 不 使 用 nanosleep 或 clock nanosleep 的 情况 下 使 它 
成 为 线程 安全 的 。 

12.7 调用 fork 以 后 ， 是 否 可 以 通过 首先 用 pthread_cond_destroy 销毁 条 件 变 量 ， 然 后 用 
pthread cond init 初始 化 条 件 变 量 这 种 方法 安全 地 在 子 进程 中 对 条 件 变 量 进行 重新 初 
始 化 ? 

12.8 12-8 FA timeout 函数 可 以 大 大 简化 ， 解 释 其 原因 。 


13 5 
守护 进程 





13.1 引言 


守护 进程 (daemon) 是 生存 期 长 的 一 种 进程 。 它 们 常常 在 系统 引导 装 入 时 启动 ， 仅 在 系统 关 
闭 时 才 终 止 。 因 为 它们 没有 控制 终端 ， 所 以 说 它们 是 在 后 台 运 行 的 。UNIX 系统 有 很 多 守护 进程 ， 
它们 执行 日 常事 务 活 动 。 

本 章 将 说 明 守 护 进程 结构 ， 以 及 如 何 编写 守护 进程 程序 。 因 为 守护 进程 没有 控制 终端 ， 我 们 
需要 了 解 在 出 现 问题 时 ， 守 护 进程 如 何 报告 出 错 情 况 。 


有 关 守 护 进 程 这 一 术语 被 应 用 于 计算 机 系统 的 历史 背景 ， 详 见 Raymond[1996]。 


13.2 ”守护 进程 的 特征 


让 我 们 先 来 看 一 些 常 用 的 系统 守护 进程 ， 以 及 它们 是 怎样 和 第 9 章 中 叙述 的 进程 组 、 控 制 终 
端 和 会 话 这 三 个 概念 相关 联 的 。ps(1) 命 令 打印 系统 中 各 个 进程 的 状态 。 该 命令 有 多 个 选项 ， 有 关 
细节 请 参考 系统 手册 。 为 了 解 本 节 讨论 中 所 需 的 信息 ， 我 们 在 基于 BSD 的 系统 下 执行 : 

ps -axj 
选项 -a 显示 由 其 他 用 户 所 拥有 的 进程 的 状态 ，-x 显示 没有 控制 终端 的 进程 状态 ，-j 显示 与 作业 

有 关 的 信息 : 会 话 ID、 进 程 组 ID、 控 制 终端 以 及 终端 进程 组 ID。 在 基于 System V 的 系统 中 ,与 

此 相 类 似 的 命令 是 ps -efj (为 了 提高 安全 性 ， 某 些 UNIX 系统 不 允许 用 户 使 用 ps 命令 查看 不 
属于 自己 的 进程 )。ps 的 输出 大 致 是 


UID PID PPID PGID SID TTY | COMD 

root 1 0 1 工 ?  /sbin/init 
root 2 0 0 0 ?  [kthreadd] 
root 3 2 0 0 ?  [ksoftirqd/0] 
root 6 2 Ü 0 ?  [migration/0] 
root 7 2 0 0 ?  [watchdog/0] 
root 21 2 0 0 ? [cpuset] 

root 22 2 0 0 ? [khelper] 
root 26 2 0 0 ? [sync supers] 
root 27 2 0 0 ? [bdi-default] 
root 29 2 0 ?  [kblockd] 
root 35 2 0 0 ?  [kswapd0] 
root 49 2 0 0 ? [scsi eh 0] 
root 256 2 0 0 ?  [jbd2/sda5-8] 
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root 257 2 0 0 ? [ext4-dio-unwrit] 
syslog 847 1 843 843 ? rsyslogd -c5 

root 906 1 906 906 ?  /usr/sbin/cupsd -F 
root 1037 1 1037 1037 ?  /usr/sbin/inetd 
root 1067 1 1067 1067 ? cron 

daemon 1068 1 1068 1068 ? atd 

root 8196 1 8196 8196 ?  /usr/sbin/sshd -D 
root 13047 2 0 0 ?  [kworker/1:0] 

root 14596 2 0 0 ? [flush-8:0] 

root 26464 1 26464 26464 ? rpcbind -w 

statd 28490 1 28490 28490 ? rpc.statd -L 

root 28553 2 0 0 ?  [rpciod] 

root 28554 2 0 0 2  [nfsiod] 

root 28561 1 28561 28561 ?  rpc.idmapd 

root 28761 2 0 0 ? | [lockd] 

root 28764 2 0 0 ?  [nfsd]) 

root 28775 1 28775 | 28775 ?  /usr/sbin/rpc.mountd --manage-gids 


其 中 , 已 移 去 了 一 些 我 们 不 感 兴趣 的 列 ， 如 累计 CPU 时 间 。 按 照 顺序 ， 各 列 标题 的 意义 分 别 是 用 
户 ID、 进 程 ID、 父 进程 ID、 进 程 组 ID、 会 话 ID、 终 端 名 称 以 及 命令 字符 串 。 


此 ps 命令 在 支持 会 话 ]D 的 系统 (Linux 3.2.0) 上 运行 ,9.5 节 的 setsid AA P RRALLE 
ID。 简 单 地 说 ， 它 就 是 会 话 首 进程 的 进程 ID。 但是, 一些 基 于 BSD 的 系统 ,如 Mac OS X 10.6.8, 
将 打印 与 本 进程 所 属 进 程 组 对 应 的 session 结构 的 地 址 { 见 9.11 节 )， 而 非 会 话 ID 的 地 址 。 


系统 进程 依赖 于 操作 系统 实现 。 父 进程 ID 为 0 的 各 进程 通常 是 内 核 进 程 ， 它 们 作为 系统 引 
导 装 入 过 程 的 一 部 分 而 启动 。(init 是 个 例外 ， 它 是 一 个 由 内 核 在 引导 装 入 时 启动 的 用 户 层次 的 
hm.) 内 核 进程 是 特殊 的 ， 通 常 存 在 于 系统 的 整个 生命 期 中 。 它 们 以 超级 用 户 特权 运行 ， 无 控 
制 终端 ， 无 命令 行 。 464 
在 ps 的 输出 实例 中 ， 内 核 守 护 进 程 的 名 字 出 现在 方 括号 中 。 该 版 本 的 Linux. 使 用 一 个 名 为 
kthreadd 的 特殊 内 核 进 程 来 创建 其 他 内 核 进程 ， 所 以 kthreadd 表现 为 其 他 内 核 进程 的 父 进 
程 。 对 于 需要 在 进程 上 下 文 执行 工作 但 却 不 被 用 户 层 进程 上 下 文 调 用 的 每 一 个 内 核 组 件 ， 通 常 有 
它 自己 的 内 核 守护 进程 。 例 如 ， 在 Linux 中 : 
e kswapd 守护 进程 也 称 为 内 存 换 页 守护 进程 。 它 支持 虚拟 内 存 子 系统 在 经 过 一 段 时 间 后 将 
脏 页 面 慢 慢 地 写 回 磁盘 来 回收 这 些 页 面 。 
e flush 守护 进程 在 可 用 内 存 达 到 设 午 的 最 小 闪 值 时 将 脏 页 面 冲 洗 至 磁盘 . 它 也 定期 地 将 脏 页 面 
冲洗 回 磁盘 来 减少 在 系统 出 现 故障 时 发 生 的 数据 丢失 。 多 个 冲洗 守护 进程 可 以 同时 存在 ， 每 个 
写 回 的 设备 都 有 一 个 冲洗 守护 进程 .输出 实例 中 显示 出 一 个 名 为 £lush-8:0 的 冲洗 守护 进程 。 
从 名 字 中 可 以 看 出 ， 写 回 设备 是 通过 主 设备 号 〈8) 和 副 设 备 号 〈0) 来 识别 的 。 
e sync supers 守护 进程 定期 将 文件 系统 元 数据 冲洗 至 磁盘 。 
。 jbd 守护 进程 帮助 实现 了 ext4 文件 系统 中 的 日 志 功能 。 
进程 1 通常 是 init (Mac OS X HE launchd), 82 节 对 此 做 过 说 明 。 它 是 一 个 系统 守护 
进程 ， 除 了 其 他 工作 外 ， 主 要 负责 启动 各 运行 层次 特定 的 系统 服务 。 这 些 服务 通常 是 在 它们 自己 
所 有 的 守护 进程 的 帮助 下 实现 的 。 
rpcbind 守护 进程 提供 将 远程 过 程 调 用 (Remote Procedure Call, RPC) 程序 号 映射 为 网 络 端口 号 
的 服务 。rsyslogd 守护 进程 可 以 被 由 管理 员 启 用 的 将 系统 消息 记 入 日 志 的 任何 程序 使 用 。 可 以 在 一 台 


374 第 13 章 守护 进程 


实际 的 控制 台 上 打印 这 些 消息 ， 也 可 将 它们 写 到 一 个 文件 中 。(13.4 节 将 对 syslog 设施 进行 说 明 。) 

9.3 HARB inetd 守护 进程 。 它 侦 听 系 统 网 络 接口 ， 以 便 取 得 来 自 网 络 的 对 各 种 网 络 服务 
进程 的 请 求 。nfsd、nfsiod、 lockd、rpciod、 rpc.idmapd、 rpc.statd 和 rpc.mountd 
守护 进程 提供 对 网 络 文件 系统 (Network File System, NFS) 的 支持 。 注 意 ， 前 4 个 是 内 核 守 护 进 
程 ， 后 3 个 是 用 户 级 守护 进程 。 

cron 守护 进程 在 定期 安排 的 日 期 和 时 间 执 行 命令 。 许 多 系统 管理 任务 是 通过 cron 每 隔 一 段 固 
定 的 时 间 就 运行 相关 程序 而 得 以 实现 的 。atd 守护 进程 与 cron 类 似 ， 它 允许 用 户 在 指定 的 时 间 执 行 
任务 ， 但 是 每 个 任务 它 只 执行 一 次 ， 而 非 在 定期 安排 的 时 间 反 复 执行 。cupsd 守护 进程 是 个 打印 假 
脱 机 进程 ， 它 处 理 对 系统 提出 的 各 个 打印 请 求 。sshd 守护 进程 提供 了 安全 的 远程 登录 和 执行 设施 。 

注意 ， 大 多 数 守 护 进程 都 以 超级 用 户 (root) 特权 运行 。 所 有 的 守护 进程 都 没有 控制 终端 ， 
其 终端 名 设置 为 问 叶 。 内 核 守 护 进程 以 无 控制 终端 方式 启动 。 用 户 层 守护 进程 缺少 控制 终端 可 能 
是 守护 进程 调用 了 setsid 的 结果 。 大 多 数 用 户 层 守护 进程 都 是 进程 组 的 组 长 进程 以 及 会 话 的 首 
进程 ， 而 且 是 这 些 进程 组 和 会 话 中 的 唯一 进程 (rsyslogd 是 一 个 例外 )。 最 后 ， 应 当 引 起 注意 

的 是 用 户 层 守护 进程 的 父 进程 是 init 进程 。 


13.3 ”编程 规则 


在 编写 守护 进程 程序 时 需 遵 循 一 些 基本 规则 ， 以 防止 产生 不 必要 的 交互 作用 。 下 面 先 说 明 这 
些 规 则 ， 然 后 给 出 一 个 按照 这 些 规则 编写 的 函数 daemonize。 

(OD 首先 要 做 的 是 调用 umask 将 文件 模式 创建 屏蔽 字 设 置 为 一 个 已 知 值 〈《 通 常 是 0)。 由 继 
承 得 来 的 文件 模式 创建 屏蔽 字 可 能 会 被 设置 为 拒绝 某 些 权限 。 如 果 守 护 进程 要 创建 文件 ， 那 么 它 
可 能 要 设置 特定 的 权限 。 例 如 ， 若 守护 进程 要 创建 组 可 读 、 组 可 写 的 文件 ， 继 承 的 文件 模式 创建 
屏蔽 字 可 能 会 屏蔽 上 述 两 种 权限 中 的 一 种 ， 而 使 其 无 法 发 挥 作用 。 另 一 方面 ， 如 果 守 护 进 程 调用 
的 库 函数 创建 了 文件 ， 那 么 将 文件 模式 创建 屏蔽 字 设 置 为 一 个 限制 性 更 强 的 值 (如 007) 可 能 会 
更 明智 ， 因 为 库 函 数 可 能 不 允许 调用 者 通过 一 个 显 式 的 函数 参数 来 设置 权限 。 

(2) 调用 fork， 然 后 使 父 进程 exit。 这 样 做 实现 了 下 面 几 点 。 第 一 ， 如 果 该 守护 进程 是 作 
为 一 条 简单 的 shell 命令 启动 的 ， 那 么 父 进程 终止 会 让 shell 认为 这 条 命令 已 经 执行 完毕 。 第 二 ， 
虽然 子 进程 继承 了 父 进程 的 进程 组 ID， 但 获得 了 一 个 新 的 进程 DD， 这 就 保证 了 子 进程 不 是 一 个 
进程 组 的 组 长 进程 。 这 是 下 面 将 要 进行 的 setsid 调用 的 先决 条 件 。 

(3) 调用 setsid 创建 一 个 新 会 话 。 然 后 执行 9.5 节 中 列 出 的 3 个 步骤 ， 使 调用 进程 : (a) 成 为 
新 会 话 的 首 进程 ，(b) 成 为 一 个 新 进程 组 的 组 长 进程 ，(c) 没有 控制 终端 。 


在 基于 System V 的 系统 中 ， 有 些 人 建议 在 此 时 再 次 调用 fork, 终止 父 进程 ， 继 续 使 用 子 进 
| 程 中 的 守护 进程 。 这 就 保证 了 该 守护 进程 不 是 会 话 首 进程 ， 于 是 按照 System V 规则 (296 F ) 
. 可 以 防止 它 取得 控制 终端 。 为 了 避免 取得 控制 终端 的 另 一 种 方法 是 ,无 论 何 时 打开 一 个 终端 设备 ， 
”都 一 定 要 指定 O NOCTTY, 


(4) 将 当前 工作 目录 更 改 为 根 目录 。 从 父 进程 处 继承 过 来 的 当前 工作 目录 可 能 在 一 个 挂 载 的 
文件 系统 中 。 因 为 守护 进程 通常 在 系统 再 引导 之 前 是 一 直 存在 的 ， 所 以 如 果 守 护 进程 的 当前 工作 
目录 在 一 个 挂 载 文 件 系统 中 ， 那 么 该 文件 系统 就 不 能 被 卸载 。 

或 者 ， 某 些 守 护 进程 还 可 能 会 把 当前 工作 目录 更 改 到 某 个 指定 位 置 ， 并 在 此 位 置 进行 它们 的 
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全 部 工作 。 例 如 ， 行 式 打印 机 假 脱 机 守护 进程 就 可 能 将 其 工作 目录 更 改 到 它们 的 spool 目录 上 。 

(5) 关闭 不 再 需要 的 文件 描述 符 。 这 使 守护 进程 不 再 持 有 从 其 父 进程 继承 来 的 任何 文件 措 述 
符 《〈 父 进程 可 能 是 shell 进程 ， 或 某 个 其 他 进程 )。 可 以 使 用 open max AM ( 见 2.17 节 ) 或 
getrlimit 函数 ( 见 7.11 节 ) 来 判定 最 高 文件 描述 符 值 ， 并 关闭 直到 该 值 的 所 有 描述 符 。 

(6) 某 些 守护 进程 打开 /dev/null 使 其 具有 文件 描述 符 0、1 和 2， 这样， 任何 一 个 试图 读 标 准 
输入 、 写 标准 输出 或 标准 错误 的 库 例 程 都 不 会 产生 任何 效果 。 因 为 守护 进程 并 不 与 终端 设备 相关 联 ， 
所 以 其 输出 无 处 显示 ， 也 无 处 从 交互 式 用 户 那 里 接收 输入 。 即 使 守护 进程 是 从 交互 式 会 话 启 动 的, 但 
是 守护 进程 是 在 后 台 运 行 的 ， 所 以 登录 会 话 的 终止 并 不 影响 守护 进程 。 如 果 其 他 用 户 在 同一 终端 设备 
上 登录 ， 我 们 不 希望 在 该 终端 上 见 到 守护 进程 的 输出 , 用户 也 不 期 望 他 们 在 终端 上 的 输入 被 守护 进程 
读 取 。 

m 2: P 
13-1 所 示 的 函数 可 由 一 个 想 要 初始 化 为 守护 进程 的 程序 调用 。 


#include "apue.h" 
#include <syslog.h> 
#include «fcntl.h» 
#include <sys/resource.h> 


void 
daemonize(const char *cmd) 


{ 


int i, fdO, fdl, fd2; 
pid t pid; 
struct rlimit rl; 


struct sigaction sa; 


/* 
* Clear file creation mask. 
žy 


umask (0)? 


/* 
* Get maximum number of file descriptors. 
Tf 
if (getrlimit(RLIMIT NOFILE, &rl) < 0) 
err quit("$s: can't get file limit", cmd); 


/* 
* Become a session leader to lose controlling TTY. 
*/ 
if ((pid = fork()) < 0) 
err quit("$s: can't fork", cmd); 
else if (pid != 0) /* parent */ 
exit(0); 
setsid(); 


/* 

* Ensure future opens won't allocate controlling TTYs. 
£y 

Sa.sa handler = SIG IGN; 
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467 sigemptyset(&sa.sa mask); 
sa.sa flags = 0; 
if (sigaction(SIGHUP, &sa, NULL) < 0) 
err quit("$s: can't ignore SIGHUP", cmd); 
if ((pid = fork()) < 0) 
err quit("$s: can't fork", cmd); 
else if (pid !- 0) /* parent */ 
exit(0); 


/* 
* Change the current working directory to the root so 
* we won't prevent file systems from being unmounted. 
*/ 
if (chdir("/") < 0) 

err quit("$s: can't change directory to /", cmd); 


/* 

* Close all open file descriptors. 

Ny 

if (rl.rlim max == RLIM INFINITY) 
rl.rlim max - 1024; 

for (i = 0; i « rl.rlim max; i++) 


close(i); 
/* 
* Attach file descriptors 0, 1, and 2 to /dev/null. 
ay 
fd0 = open("/dev/null", O_RDWR)? 
fdl = dup(0); 
fd2 = dup(0); 
/* 
* Initialize the log file. 
ay 


openlogí(cmd, LOG CONS, LOG DAEMON); 
if (fdO !=0 || fdl != 1 || fd2 != 2) ( 
syslog(LOG_ERR, "unexpected file descriptors %d %d %d", 
fd0, fdl, fd2); 
exit (1); 





13-1 初始 化 一 个 守护 进程 


X daemonize MAH main 程序 调用 , 然后 main 程序 进入 休眠 状态 , 那么 可 以 用 ps 命令 
检查 该 守护 进程 的 状态 : 


$ ./a.out 

$ ps -e£j 

UID PID PPID PGID SID TTY CMD 

sar 13800 1 13799 13799 ? ./a.out 
$ ps -efj | grep 13799 

sar 13800 1 13799 13799 ? ./a.out 


我 们 也 可 用 ps 命令 验证 ， 没 有 活动 进程 存在 的 ID 是 13799。 这 意味 着 ， 守 护 进程 在 一 个 孤儿 进程 


组 中 ( 见 9.10 节 )， 它 不 是 会 话 首 进 程 ， 因 此 没有 机 会 被 分 配 到 一 个 控制 终端 。 这 一 结果 是 在 
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daemonize 函数 中 执行 第 二 个 fork 造成 的 。 可 以 看 出 ， 守 护 进程 已 经 被 正确 地 初始 化 了 。 
13.4 ”出 错 记录 


守护 进程 存在 的 一 个 问题 是 如 何 处 理 出 错 消息 。 因 为 它 本 就 不 应 该 有 控制 终端 ， 所 以 不 能 只 

是 简单 地 写 到 标准 错误 上 。 我 们 不 希望 所 有 守护 进程 都 写 到 控制 台 设 备 上 ， 因 为 在 很 多 工作 站 上 

控制 台 设 备 都 运行 着 一 个 窗口 系统 。 我 们 也 不 希望 每 个 守护 进程 将 它 自己 的 出 错 消息 写 到 一 个 单 

独 的 文件 中 。 对 任何 一 个 系统 管理 人 员 而 言 , 如 果 要 关心 哪 一 个 守护 进程 写 到 哪 一 个 记录 文件 中 ， 

并 定期 地 检查 这 些 文件 ， 那 么 一 定 会 使 他 感到 头痛 。 所 以 ， 需 要 有 一 个 集中 的 守护 进程 出 错 记录 
设施 。 

BSD syslog 设施 是 在 伯克利 开发 的 ， 广 泛 应 用 于 4.2BSD。 从 BSD 派生 的 很 多 系统 都 支持 

syslog。 在 SVR4 之 前 ，System V 中 从 来 没有 一 个 集中 的 守护 进程 记录 设施 。 在 Single UNIX 

` Specification 的 XSI 扩展 中 包括 了 syslog BK, 


B 4.2BSD 以 来 , BSD 的 syslog 设施 得 到 了 广泛 的 应 用 。 大 多 数 守护 进程 都 使 用 这 一 设施 。 
图 13-2 显示 了 syslog 设施 的 详细 组 织 结 构 。 


被 写 入 文件 或 已 
发 录用 户 或 发 送 至 
另 一 个 主机 


syslogd 






/dev/klog 


I i 
1 l 
1 l 
1 l 
! UNIX 因特网 域 数据 | 
| “” 域 数据 报 套 接 字 报 套 接 字 | 
| l 
! | 
I 
i I 
| CE ERE J 

TCP/IP 网 络 
13-2 BSD 的 syslog 设施 
有 以 下 3 种 产生 日 志 消 息 的 方法 。 


(1) 内 核 例 程 可 以 调用 log 函数。 任何 一 个 用 户 进程 都 可 以 通过 打开 Copen) FER 
(read) /dev/klog 设备 来 读 取 这 些 消息 。 因 为 我 们 无 意 编写 内 核 例 程 ， 所 以 不 再 进一步 说 
明 此 函数 。 

(2) 大 多 数 用 户 进 程 (守护 进程 ) 调用 syslog(3) 函 数 来 产生 日 志 消 息 。 我 们 将 在 下 面 说 明 
其 调用 序列 。 这 使 消息 被 发 送 至 UNIX 域 数据 报 套 接 字 /dev/log。 

(3) 无 论 一 个 用 户 进 程 是 在 此 主机 上 ， 还 是 在 通过 TCP/IP 网 络 连接 到 此 主机 的 其 他 主机 上 ， 
都 可 将 日 志 消 息 发 向 UDP 端口 514。 注 意 ，syslog 函数 从 不 产生 这 些 UDP 数据 报 ， 它 们 要 求 
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产生 此 日 志 消 息 的 进程 进行 显 式 的 网 络 编程 。 

XT UNIX 域 套 接 字 以 及 UDP 套 接 字 的 细节 ， 请 参阅 Stevens. Fenner 和 Rudoff[2004]。 

通常 ,syslogd 守护 进程 读 取 所 有 3 种 格式 的 日 志 消 息 。 此 守护 进程 在 启动 时 读 一 个 配置 文 
件 ， 其 文件 名 一 般 为 /etc/syslog .conf， 该 文件 决定 了 不 同 种 类 的 消息 应 送 向 何 处 。 例 如 ， 
紧急 消息 可 发 送 至 系统 管理 员 〈 若 已 登录 )， 并 在 控制 台 上 打印 ， 而 警告 消息 则 可 记录 到 一 个 文 
件 中 。 

该 设施 的 接口 是 syslog 函数 。 


#include <syslog.h> 


void openlog(const char *ident, int option, int facility); 


void syslog(int priority, const char *format, ...); 
void closelog(void); 


int setlogmask(int maskpri); 





返回 值 : 前 日 志 记 录 优 先 级 屏蔽 字 值 


调用 openlog 是 可 选择 的 。 如 果 不 调 用 openLog， 则 在 第 一 次 调用 syslog 时 ， 自 动 调用 
openlog。 调 用 closelog 也 是 可 选择 的 ， 因 为 它 只 是 关闭 曾 被 用 于 与 syslogd 守护 进程 进行 
通信 的 描述 符 。 

调用 openlog 使 我 们 可 以 指定 一 个 ident. Wik, kb iden 将 被 加 至 每 则 日 志 消 息 中 。iaemr 
一 般 是 程序 的 名 称 〈 如 cron, inetd). option 参数 是 指定 各 种 选项 的 位 屏蔽 。 图 13-3 介绍 了 可 
用 的 option O). ÆT Single UNIX Specification 的 openlog 定义 中 包括 了 该 选项 ， 则 在 XSI 
列 中 用 一 个 黑 点 表示 。 


LOG_CONS 若 日 志 消 息 不 能 通过 UNIX 域 数据 报 送 至 syslogd， 则 将 该 消息 写 至 控制 台 

LOG NDELAY 立即 打开 至 syslogd 守护 进程 的 UNIX 域 数据 报 套 接 字 ， 不 要 等 到 第 一 条 消息 
已 经 被 记录 时 再 打开 。 通 常 ， 在 记录 第 一 条 消息 之 前 ， 不 打开 该 套 接 字 

LOG NOWAIT 不 要 等 待 在 将 消息 记 入 日 志 过 程 中 可 能 已 创建 的 子 进程 。 因 为 在 syslog 调用 
wait 时 ， 应 用 程序 可 能 已 获得 了 子 进程 的 状态 ， 这 种 处 理 阻 止 了 与 捕捉 SIGCHLD 


信号 的 应 用 程序 之 间 产 生 的 冲突 
LOG ODELAY 在 第 一 条 消息 被 记录 之 前 延迟 打开 至 syslogd 守护 进程 的 连接 
LOG_PERROR 除 将 日 志 消 息 发 送 给 syslogd 以 外 ,， 还 将 它 写 至 标准 出 错 (在 Solaris 上 不 可 用 ) 
LOG PID 记录 每 条 消息 都 要 包含 进程 ID。 此 选项 可 供 对 每 个 不 同 的 请 求 都 fork 一 个 子 进 
程 的 守护 进程 使 用 (与 从 不 调用 fork 的 守护 进程 相 比 较 ， 如 syslogd) 





图 13-3 openlog 的 option 参数 

openlog 的 facility 参数 值 选 取 自 图 13-4。 注 意 ，Single UNIX Specification 只 定义 了 facility 
所 有 参数 值 中 的 一 个 子 集 ， 该 子 集 一 般 只 能 用 在 一 个 给 定 的 平台 上 。 RE facility 参数 的 目的 是 可 
以 让 配置 文件 说 明 , 来 自 不 同 设施 的 消息 将 以 不 同 的 方式 进行 处 理 。 如 果 不 调 用 open1og, 或 者 
以 facility 为 0 来 调用 它 ， 那 么 在 调用 syslog, RP facility {EX priority 参数 的 一 个 部 分 进行 
说 明 。 

调用 syslog 产生 一 个 日 志 消 息 。 其 priority BRE facility 和 level 的 组 合 ， 它 们 可 选取 
的 值 分 别 列 于 facility (LA 13-4) 和 level CILE] 13-5) F. level 值 按 优先 级 从 最 高 到 最 低 依 
次 排列 。 
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em ET c 


LOG AUDIT 审计 设施 

LOG AUTH 授权 程序 ，login、su、getty 等 
5j Loc AuTH 相同 , 但 写 日 志文 件 时 具 
有 权限 限制 




















LOG_AUTHPRIV 






































































LOG_CONSOLE 消息 写 入 /dev/console 
LOG_CRON cron 和 at 

LOG_DREMON 系统 守护 进程 ， inetd、routed 等 
LOG FTP FIP 守护 进程 CftpaD 

LOG, KERN 内 核 产 生 的 消息 

LOG LOCALO 保留 由 本 地 使 用 

LOG LOCAL1 保留 由 本 地 使 用 

LOG LOCAL2 保留 由 本 地 使 用 

LOG_LOCAL3 保留 由 本 地 使 用 

LOG_LOCAL4 保留 由 本 地 使 用 

LOG_LOCRL5 保留 由 本 地 使 用 

LOG, LOCAL6 保留 由 本 地 使 用 

LOG LOCAL? 保留 由 本 地 使 用 

LOG LPR 行 式 打 印 机 系统 ，1lpd、lpc 等 
LOG_MAIL 邮件 系统 

LOG_NEWS Usenet 网 络 新 闻 系 统 

LOG_NTP 网 络 时 间 协 议 系统 

LOG SECURITY 安全 子 系统 

LOG SYSLOG syslogd 守护 进程 本 身 
LOG_USER 来 自 其 他 用 户 进程 的 消息 (默认 ) 


UUCP 系统 
13-4 openiog 的 facility 参数 


LOG_UUCP 


LOG_EMERG 紧急 《系统 不 可 使 用 ) (最 高 优先 级 ) 
LOG ALERT 必须 立即 修复 的 情况 
LOG CRIT 严重 情况 〈 如 硬件 设备 出 错 ) 


LOG ERR 出 错 情况 

LOG WARNING 警告 情况 

LOG NOTICE 正常 但 重要 的 情况 

LOG INFO 信息 性 消息 

LOG DEBUG 调试 消息 《最低 优 先 级 ) 


13-5 syslog 中 的 level ( 按 序 排列 ) 


将 format 参数 以 及 其 他 所 有 参数 传 至 vsprintf 函数 以 便 进行 格式 化 。 在 format 中 ， 每 个 
出 现 的 sm 字符 都 先 被 代 换 成 与 errno 值 对 应 的 出 错 消息 字符 串 (strerror)。 

setlogmask 函数 用 于 设置 进程 的 记录 优先 级 屏蔽 字 。 它 返回 调用 它 之 前 的 屏蔽 字 。 当 设置 
了 记录 优先 级 屏蔽 字 时 ， 各 条 消息 除非 已 在 记录 优先 级 屏蔽 字 中 进行 了 设置 ， 否 则 将 不 被 记录 。 
注意 ， 试 图 将 记录 优先 级 屏蔽 字 设 置 为 0 并 不 会 有 什么 作用 。 

很 多 系统 也 将 logger(1) 程 序 作 为 向 syslog 设施 发 送 日 志 消 息 的 方法 。 虽 然 Single UNIX 
Specification 没有 定义 任何 可 选 参数 ， 但 某 些 实现 允许 将 该 程序 的 可 选 参数 指定 为 facility. level 
和 ident. logger 命令 是 专门 为 以 非 交互 方式 运行 的 需要 产生 日 志 消 息 的 shell 脚本 设计 的 。 
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al 
在 一 个 〈 假 定 的 ) 行 式 打印 机 假 脱 机 守护 进程 中 ， 可 能 包含 有 下 面 的 调用 序列 : 


openlog("lpd", LOG PID, LOG LPR); 
syslog(LOG ERR, "open error for $s: $m", filename); 


第 一 个 调用 将 ident 字符 串 设置 为 程序 名 , 指定 该 进程 ID 要 始终 被 打印 ,并 且 将 系统 默认 的 facility 
设 定 为 行 式 打印 机 系统 。 对 syslog 的 调用 指定 一 个 出 错 条 件 和 一 个 消息 字符 串 。 如 车 不 调用 
openlog， 则 第 二 个 调用 的 形式 可 能 是 : 
syslog(LOG ERR | LOG LPR, "open error for $s: $m", filename); 
其 中 ， 将 priority 参数 指定 为 level 和 facility 的 组 合 。 = 
除了 syslog， 很 多 平台 还 提供 它 的 一 种 变 体 来 处 理 可 变 参 数列 表 。 





本 书 说 明 mos 4 种 平台 都 提供 vsyslog, 但 Single UNIX Specification 中 并 不 包括 它 。 注 
: 意 ， 如 果 要 使 它 的 声明 对 应 用 程序 可 见 ， 可 能 需要 定义 一 个 额外 的 符号 ， 例 如 ， 在 FreeBSD 
X  BSD VISIBLE 或 在 Linux 中 定义 ”USE BSD. 


KER syslog 实现 将 使 消息 短 时 间 处 于 队列 中 。 如 果 在 此 段 时 间 中 有 重复 消息 到 达 ， 那 么 
syslog 守护 进程 不 会 把 它 写 到 日 志 记录 中 ， 而 是 会 打印 输出 一 条 类 似 于 “上 一 条 消息 重复 了 N 
次 ”的 消息 。 


13.5 单 实 例 守 护 进程 


为 了 正常 运作 ， 某 些 守护 进程 会 实现 为 ， 在 任 一 时 刻 只 运行 该 守护 进程 的 一 个 副本 。 例 如 ， 
这 种 守护 进程 可 能 需要 排 它 地 访问 一 个 设备 。 对 cron 守护 进程 而 言 , 如 果 同 时 有 多 个 实例 运行 ， 
那么 每 个 副本 都 可 能 试图 开始 某 个 预定 的 操作 , 于 是 造成 该 操作 的 重复 执行 , 这 很 可 能 导致 出 错 。 

如 果 守 护 进 程 需要 访问 一 个 设备 ， 而 该 设备 驱动 程序 有 时 会 阻止 想 要 多 次 打开 /dev 目录 下 
相应 设备 节点 的 尝试。 这 就 限制 了 在 一 个 时 刻 只 能 运行 守护 进程 的 一 个 副本 。 但 是 如 果 没 有 这 种 
设备 可 供 使 用 ， 那 么 我 们 就 需要 自行 处 理 。 

文件 和 记录 锁 机 制 为 一 种 方法 提供 了 基础 ， 该 方法 保证 一 个 守护 进程 只 有 一 个 副本 在 运行 。 
(文件 和 记录 锁 将 在 14.3 节 中 讨论 。) 如 果 每 一 个 守护 进程 创建 一 个 有 固定 名 字 的 文件 ， 并 在 该 文 
件 的 整体 上 加 一 把 写 锁 ， 那 么 只 允许 创建 一 把 这 样 的 写 锁 。 在 此 之 后 创建 写 锁 的 尝试 都 会 失败 ， 
这 向 后 续 守 护 进程 副本 指明 已 有 一 个 副本 正在 运行 。 

文件 和 记录 锁 提 供 了 一 种 方便 的 互 斥 机 制 。 如 果 守 护 进程 在 一 个 文件 的 整体 上 得 到 一 把 写 
锁 ， 那 么 在 该 守护 进程 终止 时 ， 这 把 锁 将 被 自动 删除 。 这 就 简化 了 复原 所 需 的 处 理 ， 去 除了 对 以 
前 的 守护 进程 实例 需要 进行 清理 的 有 关 操 作 。 


“ek 
图 13-6 所 示 的 函数 说 明了 如 何 使 用 文件 和 记录 锁 来 保证 只 运行 一 个 守护 进程 的 一 个 副本 。 





#include <unistd.h> 
#include <stdlib.h> 
#include «fcntl.h» 
#include <syslog.h> 
#Hinclude <string.h> 
#include <errno.h> 
finclude <stdio.h> 
#include <sys/stat.h> 


#define LOCKFILE "/var/run/daemon. pid" 
#define LOCKMODE (S_IRUSR|S_IWUSR|S_IRGRP|S_IROTH) 


extern int lockfile(int); 


int 


already running (void) 


{ 


int fd; 
char bu£ [16]; 


fd - open(LOCKFILE, O, RDWR|O CREAT, LOCKMODE); 
if (fd « 0) { 
Syslog(LOG ERR, "can't open $s: %s", LOCKFILE, 
exit(1); 
} 
if (lockfile(fd) < 0) { 
if (errno == EACCES || errno == EAGAIN) { 
close(fd); 
returní1); 
} 
syslog(LOG ERR, "can't lock $s: $s", LOCKFILE, 
exit(1); 
} 
ftruncate(fd, 0); 
sprintf (buf, "$1d", (long) getpid(}); 
write(fd, buf, strlen(buf) +1); 
return (0); 
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strerror(errno)); 


strerror(errno)); 


图 13-6 保证 只 运行 一 个 守护 进程 的 一 个 副本 
守护 进程 的 每 个 副本 都 将 试图 创建 一 个 文件 ， 并 将 其 进程 ID 写 到 该 文件 中 。 这 使 管理 人 员 
易于 标识 该 进程 。 如 果 该 文件 已 经 加 了 锁 ， 那 么 1ockfile RAK KK, errno 设置 为 EACCES 
或 EAGAIN， 图 13-6 中 的 函数 返回 1， 表 明 该 守护 进程 已 在 运行 。 否 则 将 文件 长 度 截断 为 0， 将 
进程 ID 写 入 该 文件 ， 图 13-6 中 的 函数 返回 0。 
需要 将 文件 长 度 截断 为 0， 其 原因 是 之 前 的 守护 进程 实例 的 进程 ID 字符 串 可 能 长 于 调用 此 函数 的 
当前 进程 的 进程 D 字符 串 。 例如， 老 以 前 的 守护 进程 的 进程 D 是 12345, 而 新 实例 的 进程 ID 是 9999, 
那么 将 此 进程 ID 写 入 文件 后 ， 在 文件 中 留 下 的 是 99995。 将 文件 长 度 截断 为 0 就 解决 了 此 问题 。 ae 
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在 UNIX 系统 中 ， 守 护 进程 遵循 下 列 通用 惯例 。 
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若 守 护 进 程 使 用 锁 文件 ， 那 么 该 文件 通常 存储 在 /var/run 目录 中 。 然 而 需要 注意 的 是 ， 
守护 进程 可 能 需要 具有 超级 用 户 权 限 才 能 在 此 目录 下 创建 文件 。 锁 文件 的 名 字 通 常 是 
name .pid， 其 中 ，name 是 该 守护 进程 或 服务 的 名 字 。 例 如 ，cron 守护 进程 锁 文 件 的 名 
字 是 /var/run/crond.pid。 

车 守护 进程 支持 配置 选项 ， 那 么 配置 文件 通常 存放 在 /etc 目录 中 。 配 置 文件 的 名 字 通 常 
是 name.conf,. HF, name 是 该 守护 进程 或 服务 的 名 字 。 例 如 ，syslogad 守护 进程 的 
配置 文件 通常 是 /etc/syslog.conf。 

守护 进程 可 用 命令 行 语 动 ， 但 通常 它们 是 由 系统 初始 化 脚本 之 一 〈( /etc/rc* 或 
/etc/init.d/*) 启动 的 。 如 果 在 守护 进程 终止 时 ， 应 当 自 动 地 重新 启动 它 ， 则 我 们 可 
在 /etc/inittab 中 为 该 守护 进程 包括 respawn CRM, 这样，init 就 将 重新 启动 该 
守护 进程 。( 假 定 系统 使 用 System V 风格 的 init t+.) 

若 一 个 守护 进程 有 一 个 配置 文件 ， 那 么 当 该 守护 进程 启动 时 会 读 该 文件 ， 但 在 此 之 后 一 
般 就 不 会 再 查看 它 。 若 某 个 管理 员 更 改 了 配置 文件 ， 那 么 该 守护 进程 可 能 需要 被 停止 ， 
然后 再 启动 ， 以 使 配置 文件 的 更 改 生效 。 为 避免 此 种 麻烦 ， 某 些 守 护 进 程 将 捕捉 SIGHUP 
信号 ， 当 它们 接收 到 该 信号 时 ， 重 新 读 配 置 文件 。 因 为 守护 进程 并 不 与 终端 相 结 合 ， 它 
们 或 者 是 无 控制 终端 的 会 话 首 进程 ， 或 者 是 孤儿 进程 组 的 成 员 ， 所 以 守护 进程 没有 理由 
期 望 接收 SIGHUP。 于 是 ， 守 护 进程 可 以 安全 地 重复 使 用 SIGHUP. 


^. Xi 

13-7 所 示 的 程序 说 明了 守护 进程 可 以 重读 其 配置 文件 的 一 种 方法 。 该 程序 使 用 sigwait 
以 及 多 线程 ， 对 此 我 们 已 经 在 12.8 节 讨 论 过 。 
#include "apue.h" 


#include «pthread.h» 
#include <syslog.h> 


sigset t mask; 


extern int already running(void); 


void 


reread(void) 


{ 


gh ovr. 


} 


void * 


*/ 


thr fn(void *arg) 


i 


int err, signo; 


for (::) d 


err - sigwait(&mask, &signo); 

if (err != 0) 1 
sSyslog(LOG ERR, "sigwait failed"); 
exit(1); 


int 
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switch (signo) | 

case SIGHUP: 
syslog (LOG_INFO, "Re-reading configuration file"); 
reread(); 
break; 


case SIGTERM: 
syslog(LOG INFO, "got SIGTERM; exiting"); 
exit (0); 


default: 
syslog(LOG INFO, "unexpected signal %d\n", signo); 


) 


return (0); 


main{int argc, char *argv(]) 


{ 


int err; 
pthread_t tid; 
char *cmd; 


struct sigaction sa; 


if ((cmd = strrchr(argv[0], '/')) == NULL) 
cmd = argv[0]: 

else 
cmd++; 


/* 
* Become a daemon. 
xy 


daemonize (cmd); 


/* 
* Make sure only one copy of the daemon is running. 
*/ 
if (already running()) 1 
syslog(LOG ERR, "daemon already running"); 


exit(1); 
) 
/* 
* Restore SIGHUP default and block all signals. 
t£ 


sa.Sa handler = SIG_DFL; 

sigemptyset(&sa.sa mask); 

sa.sa flags = 0; 

if (sigaction(SIGHUP, &sa, NULL) < 0) 476 
err quit("$s: can't restore SIGHUP default"); 

sigfillset (&mask) ; 

if ((err = pthread sigmask(SIG BLOCK, &mask, NULL)) != 0) 
err exití(err, "SIG BLOCK error"); 
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/* 
* Create a thread to handle SIGHUP and SIGTERM. 
*/ 
err = pthread create(&tid, NULL, thr fn, 0); 
if (err != 0) 
err exit(err, "can't create thread"); 
/* 
* Proceed with the rest of the daemon. 
*/ 
/* 1... */ 
exit (0); 


图 13-7 守护 进程 重读 配置 文件 

该 程序 调用 了 图 13-1 中 的 daemonize 来 初始 化 守护 进程 。 从 该 函数 返回 后 ， 调 用 图 13-6 中 的 
already running 函数 以 确保 该 守护 进程 只 有 一 个 副本 在 运行 。 到 达 这 一 点 时 ，SIGHUP 信和 号 仍 被 
忽略 ， 所 以 需 恢复 对 该 信号 的 系统 默认 处 理 方式 ， 耕 则 调用 sigwait 的 线程 决 不 会 见 到 该 信号 。 

如 同 对 多 线程 程序 所 推荐 的 那样 ， 阻 塞 所 有 信和 号， 然后 创建 一 个 线程 处 理 信号 。 该 线程 的 唯 
一 工作 是 等 待 SIGHUP 和 SIGTERM。 当 接收 到 SIGHUP 信和 号 时 ， 该 线程 调用 reread 函数 重读 
它 的 配置 文件 。 当 它 接收 到 SIGTERM 信号 时 ， 会 记录 消息 并 退出 。 

回顾 图 10-1, SIGHUP 和 SIGTERM 的 默认 动作 是 终止 进程 。 因 为 我 们 阻塞 了 这 些 信 号 ， 所 
以 当 SIGHUP 和 SIGTERM 的 其 中 一 个 被 发 送 到 守护 进程 时 ， 守 护 进程 不 会 消亡 。 作 为 替代 ， 调 
用 sigwait 的 线程 在 返回 时 将 指示 已 接收 到 该 信号 。 e 


二 实例 
并 非 所 有 守护 进程 都 是 多 线程 的 。 13-8 中 的 程序 说 明 一 个 单线 程 守护 进程 如 何 捕捉 
SIGHUP 并 重读 其 配置 文件 。 


#include "apue.h" 
#include <syslog.h> 
#include «errno.h» 


extern int lockfile(int); 
extern int already running(void); 


void 
reread (void) 


P* azuwct4 


void 

sigterm(int signo) 

{ 
syslog(LOG_INFO, “got SIGTERM; exiting"); 
exit (0); 


void 


sighup(int signo) 


{ 


int 
main 


( 


sSyslog(LOG INFO, 
reread(); 


(int argc, char *argv[]) 


char *omd; 
struct sigaction sa; 
if ((cmd = strrchr(argv[0], '/')) == NULL) 
cmd = argv[0]; 
else 
emd++; 


/* 
* Become a daemon. 
*/ 

daemonize (cmd) ; 


/* 
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"Re-reading configuration file"); 


* Make sure only one copy of the daemon is running. 


*/ 
if (already running()) 1 
syslog(LOG ERR, 


exit(1):; 
} 
/* 
* Handle signals of interest. 
#7 


sa.sa handler = sigterm; 

sigemptyset(&sa.sa mask); 

sigaddset(&sa.sa mask, SIGHUP); 

sa.sa flags = 0; 

if (sigaction(SIGTERM, 
syslog(LOG ERR, 
exití1); 


&sa, NULL) < 0) { 


} 

sa.sa_handler = sighup; 

sigemptyset (&sa.sa_mask); 

sigaddset (&sa.sa_mask, SIGTERM); 

sa.sa_flags = 0; 

if (sigaction(SIGHUP, &sa, NULL) < 0) ( 
Syslog(LOG ERR, "can't catch SIGHUP: 
exit(1); 


$s", 


/* 
* Proceed with the rest of the daemon. 


"daemon already running"); 


"can't catch SIGTERM: %s", 


strerror(errno)); 


strerror(errno)); 
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exit(0); 


图 13-8 ”守护 进程 重读 配置 文件 的 另 一 种 实现 
在 初始 化 守护 进程 后 ， 我 们 为 SIGHUP 和 SIGTERM 配置 了 信和 号 处 理 程序 。 可 以 将 重读 逻辑 
放 在 信号 处 理 程 序 中 ， 也 可 以 只 在 信号 处 理 程序 中 设置 一 个 标志 ， 并 由 守护 进程 的 主线 程 完 成 所 
有 的 工作 。 E 


13.7 ”客户 进程 -服务 器 进程 模型 


守护 进程 常常 用 作 服务 器 进程 。 确实, 我 们 可 以 称 图 13-2 中 的 syslogd 进程 为 服务 器 进程 ， 
用 户 进程 〈 客 户 进程 》 用 UNIX 域 数据 报 套 接 字 向 其 发 送 消 息 。 

一 般 而 言 ， 服 务 器 进程 等 待 客户 进程 与 其 联系 ， 提 出 某 种 类 型 的 服务 要 求 。 图 13-2 中 ， 由 
syslogd 服务 器 进程 提供 的 服务 是 将 一 条 出 错 消 息 记 录 到 日 志文 件 中 。 

图 13-2 中 ， 客 户 进程 和 服务 器 进程 之 间 的 通信 和 是 单 向 的 。 客 户 进程 向 服务 器 进程 发 送 服务 请 求 ， 
服务 器 进程 则 不 向 客户 进程 回 送 任何 消息 。 在 下 面 有 关 进 程 通信 的 儿 章 中 , 我 们 将 见 到 大 量 客户 进程 和 
服务 器 进程 之 间 双 向 通信 的 实例 。 客 户 进程 向 服务 器 进程 发 送 请求 , 服务 器 进程 则 向 客户 进程 回 送 应 答 。 

在 服务 器 进程 中 调用 fork 然后 exec 男 一 个 程序 来 向 客户 进程 提供 服务 是 很 常见 的 。 这 些 
服务 器 进程 通常 管理 着 多 个 文件 描述 符 : 通信 端点 、 配 置 文件 、 日 志文 件 和 类 似 的 文件 。 最 好 的 
情况 下 ， 让 子 进程 中 的 这 些 文件 找 述 符 保持 打开 状态 并 无 大 碍 ， 因 为 它们 很 可 能 不 会 被 在 子 进程 
中 执行 的 程序 所 使 用 ， 尤 其 是 那些 与 服务 器 端 无 关 的 程序 。 最 坏 情 况 下 ， 保 持 它们 的 打开 状态 会 
导致 安全 问题 一 一 被 执行 的 程序 可 能 有 一 些 恶 意 行为 ， 如 更 改 服务 器 端 配置 文件 或 欺骗 客户 端 程 
序 使 其 认为 正在 与 服务 器 端 通信 ， 从 而 获取 未 授权 的 信息 。 

解决 此 问题 的 一 个 简单 方法 是 对 所 有 被 执行 程序 不 需要 的 文件 描述 符 设置 执行 时 关闭 


(close-on-exec) 标志 。 图 13-9 展示 了 一 个 可 以 用 来 在 服务 器 端 进程 中 执行 上 述 工 作 的 项 数 。 


#include "apue.h" 
#include «fcntl.h» 


int 
set cloexec(int fd) 
{ 


int val: 


if ((val = fentl(fd, F GETED, 0)) < 0) 
return(-1); 


val |= FD CLOEXEC; /* enable close-on-exec */ 


return(fcntl(fd, F SETFD, val)); 
图 13-9 ”设置 执行 时 关闭 标志 
13.8 小结 
在 大 多 数 UNIX 系统 中 ， 守 护 进程 是 一 直 运 行 的 。 为 了 初始 化 我 们 自己 的 进程 ， 使 之 作为 守 
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护 进程 运行 ， 需 要 一 些 审慎 的 思索 并 理解 第 9 章 中 说 明 的 进程 之 间 的 关系 。 本 章 开发 了 一 个 可 由 
守护 进程 调用 的 能 对 其 自身 正确 初始 化 的 函数 。 

因为 守护 进程 通常 没有 控制 终端 ， 所 以 本 章 还 讨论 了 守护 进程 记录 出 错 消 息 的 几 种 方法 。 我 们 
讨论 了 在 大 多 数 UNIX 系统 中 ， 守 护 进程 遵循 的 若干 惯例 ， 给 出 了 几 个 如 何 实现 某 些 惯例 的 实例 。 


习题 


13.1 从 图 13-2 可 以 推测 出 ， 直 接 调用 openlog 或 第 一 次 调用 syslog 都 可 以 初始 化 syslog 
设施 ， 此 时 一 定 要 打开 用 于 UNIX 域 数据 报 套 接 字 的 特殊 设备 文件 /dev/1og。 如 果 调 用 
openlog AU, FAP UE FPH) AAT chroot， 结 果 会 怎么 样 ? 

13.2 回顾 13.2 节 中 ps 输出 的 示例 。 唯 一 一 个 不 是 会 话 首 进程 的 用 户 层 守 护 进程 是 rsyslogd 
进程 。 请 解释 为 什么 rsyslogd 守护 进程 不 是 会 话 首 进程 。 

13.3 列 出 你 系统 中 所 有 有 效 的 守护 进程 ， 并 说 明 它 们 各 自 的 功能 。 

13.4 编写 一 段 程序 调用 图 13-1 中 daemonize 函数 。 调 用 该 函数 后 ， 它 已 成 为 守护 进程 ， 再 调 
用 getlogin (918.15 节 ) 查看 该 进程 是 否 有 登录 名 。 将 结果 打印 到 一 个 文件 中 。 
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14.1 引言 


本 章 涵 盖 众 多 概念 和 函数 ， 我 们 把 它们 统统 都 放 到 高 级 UO Fiti: 非 阻 塞 JO、 记 录 锁 、 
VO 多 路 转 接 (select 和 poll BR). HA UO. readv 和 writev 函数 以 及 存储 映射 VO 
(mmap)。 第 15 章 和 第 17 章 中 的 进程 间 通 信和 以 及 以 后 各 章 中 的 很 多 实例 都 要 使 用 本 章 所 描述 的 
概念 和 函数 。 


14.2 FRA I/O 


10.5 节 中 曾 将 系统 调用 分 成 两 类 :“ 低 速 ” 系 统 调用 和 其 他 。 低 速 系 统 调用 是 可 能 会 使 进程 
永远 阻塞 的 一 类 系统 调用 ， 包 括 : 
。 如 果 某 些 文件 类 型 〈 如 读 管道 、 终 端 设备 和 网 络 设备 ) 的 数据 并 不 存在 ， 读 操作 可 能 会 
使 调用 者 永远 阻塞 ; 
。 如 果 数 据 不 能 被 相同 的 文件 类 型 立即 接受 〈 如 管道 中 无 空间 、 网 络 流 控 制 )， 写 操作 可 能 
会 使 调用 者 永远 阻塞 ; 
。 在 某 种 条 件 发 生 之 前 打开 某 些 文件 类 型 可 能 会 发 生 阻 塞 (如 要 打开 一 个 终端 设备 ， 需 要 
先 等 待 与 之 连接 的 调制 解 调 器 应 答 ， 又 如 若 以 只 写 模 式 打 开 FIFO， 那 么 在 没有 其 他 进程 
已 用 读 模 式 打开 该 FIFO 时 也 要 等 待 ); 
e 对 已 经 加 上 强制 性 记录 锁 的 文件 进行 读 写 ; 
e 26 ioctl 操作 ; 
。 某 些 进程 间 通 信函 数 〈 见 第 15 章 )。 
我 们 也 曾 说 过 ， 虽 然 读 写 磁盘 文件 会 暂时 阻塞 调用 者 ， 但 并 不 能 将 与 磁盘 VO 有 关 的 系统 调 
用 视 为 “低速 ” 
非 阻塞 VO 使 我 们 可 以 发 出 open. read 和 write 这 样 的 VO 操作 ， 并 使 这 些 操作 不 会 永 
远 阻 塞 。 如 果 这 种 操作 不 能 完成 ， 则 调用 立即 出 错 返回 ， 表 示 该 操作 如 继续 执行 将 阻塞 。 
对 于 一 个 给 定 的 描述 符 ， 有 两 种 为 其 指定 非 阻塞 UO 的 方法 。 
C1) 如 果 调 用 open 获得 描述 符 ， 则 可 指定 O NONBLOCK bus (53.3 节 )。 
(2) 对 于 已 经 打开 的 一 个 描述 符 ， 则 可 调用 fcnt1， 由 该 函数 打开 O NONBLOCK 文件 状态 
标志 ( 见 3.14 450. E 3-12 中 的 函数 可 用 来 为 一 个 描述 符 打 开 任 一 文件 状态 标志 。 
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System V 的 早期 版 本 使 用 标志 O_NDELRY 指定 非 阻塞 方式 。 在 这 些 System V 版 本 中 ， 如 果 无 数 


， 据 可 读 ， 则 read 返回 0。 而 UNIX 系统 又 常 将 read 的 返回 值 0 解释 为 文件 结束 ， 两 者 有 了 所 混淆 。 


POSIX.1 提供 了 一 个 非 阻塞 标志 ， 它 的 名 字 和 语义 都 与 ONDELRAY 不 同 。 确实, 在 System V 的 早期 版 
本 中 ， 当 从 read 得 到 返回 值 0 时， 我 们 并 不 知道 该 调用 是 阻塞 了 还 是 遇 到 了 文件 尾 端 。POSIX.1 要 


， 求 ， 对 于 一 个 非 阻塞 的 描述 符 如果 无 数据 可 读 ， 则 read 返回 -1，errno 被 设置 为 EAGAIN。 System V 
”派生 的 某 些 平台 既 支 持 较 旧 的 OQ_NDELRY， 又 支持 POSIX.I 的 O_NONBLOCK, 但 在 本 书 的 实例 中 只 使 


用 POSIX.) 规定 的 特征 。 较 旧 的 O_NDELAY 只 是 为 了 向 后 兼容 ， 不 应 在 新 应 用 程序 中 使 用 。 
4.3BSD 为 fcnt1l 提供 了 FNDELAY 标志 , 其 语义 也 稍 有 区 别 。 它 不 只 影响 描述 符 的 文件 状态 
未 志 ， 还 将 终端 设备 或 套 接 宇 的 标志 更 改 成 非 阻 塞 的 ， 因 此 不 仅 影 响 共 享 同一 文件 表 项 的 用 户 ， 


， 而 且 对 终端 或 套 接 字 的 所 有 用 户 起 作用 【4.3BSD 非 阻塞 VO 只 对 终端 和 套 接 字 起 作用 )。 另 外 ， 


"a c 


图 14-1 中 的 程序 是 一 个 非 阻 塞 IO 的 实例 ， 它 从 标准 输入 读 500 000 字 节 ， 并 试图 将 它们 写 到 标准 
输出 上 。 该 程序 先 将 标准 输出 设置 为 非 阻塞 的 ， 然 后 用 for 循环 进行 输出 ， 每 次 write 调用 的 结果 都 


在 标准 错误 上 打印 。 函 数 clr_f1 类 似 于 图 3-12 中 的 set_f1。 这 个 新 函数 清除 1 个 或 多 个 标志 位 。 


如 果 对 一 个 非 阻塞 描述 符 的 操作 不 能 无 阻塞 地 完成 ， 那 么 4.3BSD 返回 EWOULDBLOCK, JA, & 
T BSD 的 系统 提供 POSIX.1 的 O_NONBLOCK 标志 ， 并 且 将 EWOULDBLOCK 定义 为 与 POSIX.1 的 
EAGAIN 相同 。 这 些 系统 提供 与 其 他 POSIX 兼容 系统 相 一致 的 非 阻塞 语义 : 文件 状态 标志 的 更 改 
影响 同一 文件 表 项 的 所 有 用 户 ， 但 与 通过 其 他 文件 表 项 对 同一 设备 的 访问 无 关 。 


#include "apue.h" 
#include «errno.h» 
#include <fentl.h> 


char 


int 


buf (500000); 


main (void) 


{ 


int 
char 


fpri 


set_ 


ntowrite, nwrite; 
*ptr; 


ntowrite - read(STDIN FILENO, buf, sizeof(buf)); 


ntf(stderr, "read td bytes\n", ntowrite); 


fl(STDOUT FILENO, O NONBLOCK); /* set nonblocking */ 


ptr = buf; 
while (ntowrite » O) ( 


errno - 0; 
nwrite = write(STDOUT FILENO, ptr, ntowrite); 
fprintf(stderr, "nwrite = td, errno = %d\n", nwrite, errno); 


if (nwrite > 0) { 
ptr += nwrite; 
ntowrite -- nwrite; 
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clr fl(STDOUT FILENO, O NONBLOCK); /* clear nonblocking */ 


exit(0); 


图 14-1 ”长 的 非 阻 塞 write 
若 标准 输出 是 普通 文件 ， 则 可 以 期 望 write 只 执行 一 次 。 


$ 1s -1 /etc/services 打印 文件 长 度 
-rw-r--r-- 1 root 677959 Jun 23 2009 /etc/services 

$ ./a.out « /etc/services » temp.file 先 试 一 个 普通 文件 
read 500000 bytes 

nwrite = 500000, errno = 0 一 次 写 

$ 1s -1 temp.file 检验 输出 文件 长 度 
-rw-rw-r-- 1 sar 500000 Apr 1 13:03 temp.file 


但 是 ， 若 标准 输出 是 终端 ， 则 期 望 write 有 时 返回 小 于 500000 的 一 个 数字 ， 有 时 返回 错误 。 下 
面 是 运行 结果 ; 


$ ./a.out < /etc/services 2>stderr.out 终端 至 输出 
大 量 输出 至 终端 …… 
$ cat stderr.out 
read 500000 bytes 
nwrite = 999, errno = 0 


nwrite = -1, errno = 35 
nwrite = -1, errno = 35 
nwrite = -1, errno = 35 
nwrite = -1, errno = 35 


nwrite = 1001, errno = 0 

nwrite = -1, errno = 35 

nwrite = 1002, errno = 0 

nwrite = 1004, errno = 0 

nwrite = 1003, errno = 0 

nwrite = 1003, errno = 0 

nwrite = 1005, errno = 0 

nwrite = -l, errno = 35 61 个 此 类 错误 
nwrite = 1006, errno = 0 

nwrite = 1004, errno = 0 

nwrite = 1005, errno = 0 

nwrite = 1006, errno 0 
nwrite = -1, errno = 35 108 个 此 类 错误 


* 
- 


nwrite = 1006, errno = 0 
nwrite = 1005, errno = 
nwrite = 1005, errno = 0 

nwrite = -1, errno = 35 681 个 此 类 错误 


| 
e 


等 等 


nwrite = 347, errno = 0 


在 该 系统 上 ，errno 值 35 对 应 的 是 BEAGAIN。 终 端 驱 动 程序 一 次 能 接受 的 数据 量 随 系统 而 
变 。 具 体 结果 还 会 因 登 录 系 统 时 所 使 用 的 方式 的 不 同 而 不 同 ; 在 系统 控制 台 上 登录 、 在 硬 接线 的 
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终端 上 登录 或 用 伪 终 端 在 网 络 连接 上 和 登录。 如果 你 在 终端 上 运行 一 个 窗口 系统 ， 那 么 也 是 经 由 伪 
终端 设备 与 系统 交互 。 7 


在 此 实例 中 ， 程 序 发 出 了 9000 多 个 write WA, 但 是 只 有 500 个 真正 输出 了 数据 ， 其 余 的 
都 只 返回 了 错误 。 这 种 形式 的 循环 称 为 轮 询 ， 在 多 用 户 系 统 上 用 它 会 浪费 CPU 时 间 。14.4 节 将 介 
绍 非 阻塞 描述 符 的 IO 多 路 转 接 ， 这 是 进行 这 种 操作 的 一 种 比较 有 效 的 方法 。 
有 时 ， 可 以 将 应 用 程序 设计 成 使 用 多 线程 的 〈 见 第 11 章 )， 从 而 避免 使 用 非 阻塞 WO。 如 车 我 们 
能 在 其 他 线程 中 继续 进行 ， 则 可 以 允许 单个 线程 在 VO 调用 中 阻塞 。 这 种 方法 有 时 能 简化 应 用 程序 的 
设计 《〈 见 第 21 章 )， 但 是 ， 线 程 间 同步 的 开销 有 时 却 可 能 增加 复杂 性 ， 于 是 导致 得 不 偿 失 的 后 果 。 


14.3 ”记录 锁 


当 两 个 人 辣 时 编辑 一 个 文件 时 ， 其 后 果 将 如 何 呢 ?在 大 多 数 UNIX 系统 中 ， 该 文件 的 最 后 状 
态 取 决 于 写 该 文件 的 最 后 一 个 进程 。 但 是 对 于 有 些 应 用 程序 ， 如 数据 库 ， 进 程 上 有 时 需要 确保 它 正 
在 单独 写 一 个 文件 。 为 了 向 进程 提供 这 种 功能 ， 商 用 UNIX 系统 提供 了 记录 锁 机 制 。( 第 20 章 包 
含 了 使 用 记录 锁 的 数据 库 函 数 库 。) 

记录 锁 (record locking) 的 功能 是 : 当 第 一 个 进程 正在 读 或 修改 文件 的 某 个 部 分 时 ， 使 用 记 
录 锁 可 以 阻止 其 他 进程 修改 同一 文件 区 。 对 于 UNIX 系统 而 言 ,“ 记 录 ” 这 个 词 是 一 种 误 用 ， 因 
为 UNIX 系统 内 核 根 本 没有 使 用 文件 记录 这 种 概念 。 一 个 更 适合 的 术语 可 能 是 字 节 范围 锁 
(byte-range locking)， 因 为 它 锁 定 的 只 是 文件 中 的 一 个 区 域 〈 也 可 能 是 整个 文件 )。 

1. 历史 

对 早期 UNIX 系统 的 其 中 一 个 批评 是 它们 不 能 用 来 运行 数据 库 系 统 ， 其 原因 是 这 些 系 统 不 支 
持 对 部 分 文件 加 锁 。 在 UNIX 系统 寻找 进入 商用 计算 环境 的 途径 时 ， 很 多 系统 开发 小 组 以 各 种 不 
同方 式 增 加 了 对 记录 锁 的 支持 。 

早期 的 伯克利 版 本 只 支持 flock 函数 。 该 函数 只 能 对 整个 文件 加 锁 ,， 不 能 对 文件 中 的 一 部 分 加 锁 。 

SVR3 通过 font] 函数 增加 了 记录 锁 功 能 。 在 此 基础 上 构造 了 lockt 函数 ， 它 提供 了 一 个 
简化 的 接口 。 这 些 函 数 允 许 调用 者 对 一 个 文件 中 任意 字 节 数 的 区 域 加 锁 ， 长 至 整个 文件 ， 短 至 文 
件 中 的 一 个 字 节 。 

POSIX.1 标准 的 基础 是 fcntl 方法 。 图 14-2 列 出 了 各 种 系统 提供 的 不 同形 式 的 记录 锁 。 注 
意 ，Single UNIX Specification 在 其 XSI 扩展 中 包括 了 Lockf。 


FreeBSD 8.0 
Linux 3.2.0 

Mac OS X 10.6.8 
Solaris 10 





14-2. 各 种 UNIX 系统 支持 的 记录 锁 形 式 
本 节 最 后 部 分 将 说 明 建议 性 锁 和 强制 性 锁 之 间 的 区 别 。 本 书 只 介绍 POSIX.1 的 fenti 锁 。 
记录 锁 是 1980 年 由 John Bass 最 早 添加 到 V7 上 的 。 内 核 中 相应 的 系统 调用 入 口 项 是 名 为 


locking 的 函数 。 此 函数 提供 了 强制 性 记录 锁 功 能 ， 它 被 用 在 很 多 System II 版 本 中 。Xenix 系统 采用 
了 此 函数 ， 某 些 基于 Intel 的 System V 派生 版 本 ， 如 OpenServer 5， 在 Xenix HSA PM RHA HA, 
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2. fcntl 记录 锁 
3.14 节 中 已 经 给 出 了 fentl 函数 的 原型 ， 为 了 叙说 方便 ， 这 里 再 重复 一 次 。 


include «fcntl.h» 


int fcntl(int fd, int cmd, .../* struct flock *flockptr */); 
返回 值 : BM. KF ond OLF), Ail, El- 
对 于 记录 锁 ，cmqd Æ F GETLK. F SETLK 或 F_SETLKW。 第 三 个 参数 (我 们 将 调用 flockptr) 
是 一 个 指向 flock 结构 的 指针 。 





struct flock { 


short 1 type; /* F RDLCK, F WRLCK, or F UNLCK */ 
short l whence; /* SEEK SET, SEEK CUR, or SEEK END */ 
off t 1 start; /* offset in bytes, relative to I whence */ 
off t 1l len; /* length, in bytes; 0 means lock to EOF */ 
pid t 1 pid; /* returned with F GETLK */ 
}; 
对 flock 结构 说 明 如 下 。 
。 所 希望 的 锁 类 型 : F_RDLCK (共享 读 锁 )、F_WRLCK (独占 性 写 锁 ) 或 F_UNLCK (解锁 
一 个 区 域 )。 


。 要 加 锁 或 解锁 区 域 的 起 始 字 节 偏 移 量 (1_start 和 1_whence)。 
e 区 域 的 字 节 长 度 (Ll len). 
e 进程 的 ID (1 pid) 持 有 的 锁 能 阻塞 当前 进程 ( 仅 由 F_GETLK 返回 )。 
关于 加 锁 或 解锁 区 域 的 说 明 还 要 注意 下 列 几 项 规则 。 
© 指定 区 域 起 始 偏 移 量 的 两 个 元 素 与 lseek 函数 〈( 见 3.6 节 ) 中 最 后 两 个 参数 类 似 。1_whence 
可 选用 的 值 是 SEEK_SET、SEEK_CUR 或 SEEK END. 

© 锁 可 以 在 当前 文件 尾 端 处 开始 或 者 越过 尾 端 处 开始 ， 但 是 不 能 在 文件 起 始 位 置 之 前 开始 。 

e WA lien 为 0， 则 表示 锁 的 范围 可 以 扩展 到 最 大 可 能 偏 移 量 。 这 意味 着 不 管 向 该 文件 
中 追加 写 了 多 少数 据 ， 它 们 都 可 以 处 于 锁 的 范围 内 〈 不 必 猜 测 会 有 多 少 字 节 被 追加 写 到 
了 文件 之 后 )， 而 且 起 始 位 置 可 以 是 文件 中 的 任意 一 个 位 置 。 

e 为 了 对 整个 文件 加 锁 , 我 们 设置 1 start 和 1_whence 指向 文件 的 起 始 位 置 ， 并 且 指 定 
长 度 (1_len) 为 0。( 有 多 种 方法 可 以 指定 文件 起 始 处 ， 但 常用 的 方法 是 将 1 start fH 
定 为 0，1_whence 指定 为 SEEK SET.) 

上 面 提 到 了 两 种 类 型 的 锁 ， 共 享 读 锁 (1 type Jj L_RDLCK) 和 独占 性 写 锁 (L_WRLCK)。 基 本 规 
We: 任意 多 个 进程 在 一 个 给 定 的 字 节 上 可 以 有 一 把 共享 的 读 锁 ， 但 是 在 一 个 给 定 字 节 上 只 能 有 一 个 进 
程 有 一 把 独占 写 锁 。 进 一 步 而 言 ， 如 果 在 一 个 给 定 字 节 
上 已 经 有 一 把 或 多 把 读 锁 , 则 不 能 在 该 字 节 上 再 加 写 锁 ， 

如 果 在 一 个 字 节 上 已 经 有 一 把 独占 性 写 锁 ， 则 不 能 再 对 
它 加 任何 读 锁 。 在 图 14-3 中 示 出 了 这 些 兼 容 性 规则 。 

上 面 说 明 的 兼容 性 规则 适用 于 不 同 进程 提出 的 。 当前 区 并 
锁 请 求 ， 并 不 适用 于 单个 进程 提出 的 多 个 锁 请 求 。 如 
果 一 个 进程 对 一 个 文件 区 间 已 经 有 了 一 把 锁 , 后 来 该 
进程 又 企图 在 同一 文件 区 间 再 加 一 把 锁 ， 那 么 新 锁 将 





图 14-3 不 同类 型 锁 彼 此 之 间 的 兼容 性 
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替换 已 有 锁 。 因 此 ， 若 一 进程 在 某 文件 的 16—32 字 节 区 间 有 一 把 写 锁 ， 然 后 又 试图 在 16-32 字 
节 区 闻 加 一 把 读 锁 ， 那 么 该 请 求 将 成 功 执行 ， 原 来 的 写 锁 会 被 替换 为 读 锁 。 

加 读 锁 时 ， 该 描述 符 必 须 是 读 打 开 。 加 写 锁 时 ， 该 描述 符 必 须 是 写 打 开 。 

下 面 说 明 一 下 fcnt1 函数 的 3 种 命令 。 

F GETLK 判断 由 flockpir 所 描述 的 锁 是 否 会 被 另外 一 把 锁 所 排斥 〈 阻 塞 )。 如 果 存 在 一 
把 锁 ， 它 阻止 创建 由 flockptr 所 描述 的 锁 ， 则 该 现 有 锁 的 信息 将 重 写 flockptr 
指向 的 信息 。 如 果 不 存在 这 种 情况 ， 则 除了 将 1_type 设置 为 F_UNLCK 之 外 ， 
flockptr 所 指向 结构 中 的 其 他 信息 保持 不 变 。 

F SETLK 设置 由 flockptr 所 描述 的 锁 。 如 果 我 们 试图 获得 一 把 读 锁 (1 tvpe 为 
F_RDLCK) 或 写 锁 (1 type XJ F WRLCK)， 而 兼容 性 规则 阻止 系统 给 我 们 这 
把 锁 ， 那 么 fcnt1 会 立即 出 错 返 回 ， 此 时 errno 设置 为 EACCES 8k EAGAIN. 


虽然 POSIX.1 允许 实现 返回 这 两 种 出 错 代 码 中 的 任何 一 种 ， 但 本 书 说 明 的 4 种 实现 在 锁 
请 求 不 能 得 到 满足 时 ， 都 返回 EAGAIN。 


此 命令 也 用 来 清除 由 flockptr 指定 的 锁 (1_type 为 F_UNLCK). 487 
F_SETLKW ”这 个 命令 是 F_SETLK 的 阻塞 版 本 命令 名 中 的 W 表 示 等 待 (wait))。 如 果 所 
请 求 的 读 锁 或 写 锁 因 另 一 个 进程 当前 已 经 对 所 请 求 区 域 的 某 部 分 进行 了 加 锁 
而 不 能 被 授予 ， 那 么 调用 进程 会 被 置 为 休眠 。 如 果 请 求 创建 的 锁 已 经 可 用 ， 
或 者 休 眼 由 信号 中 斯 ， 则 该 进程 被 唤醒 。 
应 当 了 解 , 用 E GETLK 测试 能 否 建立 一 把 锁 ， 然后 用 F_SETLK 或 F_SETLKW 企图 建立 那 把 锁 ， 
这 两 者 不 是 一 个 原子 操作 。 因 此 不 能 保证 在 这 两 次 fcnt1 调用 之 间 不 会 有 另 一 个 进程 插入 并 建立 一 
把 相同 的 锁 。 如 果 不 希 望 在 等 待 锁 变 为 可 用 时 产生 阻塞 , 就 必须 处 理由 F_SETLK 返回 的 可 能 的 出 错 。 
注意 ，POSIX.1 并 没有 说 明 在 下 列 情况 下 将 发 生 什么 : 一 个 进程 在 某 个 文件 的 一 个 区 间 上 设 
置 了 一 把 读 锁 ， 第 二 个 进程 在 斌 图 对 同一 文件 区 间 加 一 把 写 锁 时 阻 窜 ， 然 后 第 三 个 进程 则 试图 在 
“同一 文件 区 间 上 得 到 另 一 把 读 锁 。 如 果 第 三 个 进程 只 是 因为 读 区 间 已 有 一 把 读 锁 ， 而 被 允许 在 该 
| 区 闻 放 置 另 一 把 读 锁 ， 那 么 这 种 实现 就 可 能 会 使 希望 加 写 锁 的 进程 局 死 。 因 此 ， 当 对 同一 区 间 加 
另 一 把 读 锁 的 请 求 到 达 时 ， 提 出 加 写 锁 而 阻塞 的 进程 需 等 待 的 时 间 了 延长 了 。 如 果 加 读 镇 的 请 求 来 
得 很 频繁 ， 使 得 该 文件 区 间 始 终 存 在 一 把 或 几 把 读 锁 ， 那 么 欲 加 写 锁 的 进程 就 将 等 待 很 长 时 间 。 
在 设置 或 释放 文件 上 的 一 把 锁 时 ， 系 统 按 要 求 组 合 或 分 裂 相 邻 区 。 例 如 ， 若 第 100—199 F 
节 是 加 锁 的 区 ， 需 解锁 第 150 字 节 ， 则 内 核 将 维持 两 把 锁 ， 一 把 用 于 第 100—149 字 节 ， 另 一 把 
用 于 第 131 一 199 iih 图 14-4 fs ee 的 字 节 范围 锁 。 





100 199 100 149 151 199 
对 第 100 —199 字 节 加 锁 后 的 文件 对 第 150 字 节 解锁 后 的 文件 
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假定 我 们 又 对 第 150 字 节 加 锁 ， 那 么 系统 将 会 再 把 3 个 相 邻 的 加 锁 区 合并 成 一 个 区 《第 100 一 
199 字 节 )。 其 结果 如 图 14-4 中 的 第 一 个 图 所 示 ， 又 跟 开 始 的 时 候 一 样 了 。 
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až: 请 求 和 释放 -一 把 锁 


为 了 避免 每 次 分 配 flock 结构 ， 然 后 又 填 入 各 项 信息 ， 可 以 用 图 14-5 所 示 的 程序 中 的 函数 
lock, reg 来 处 理 所 有 这 些 细节 。 


finclude "apue.h" 
finclude «fcnti.h» 


int 
lock reg(int fd, int cmd, int type, off t offset, int whence, off t len) 


{ 
struct flock lock; 


lock.l type = type; /* F RDLCK, F WRLCK, F UNLCK */ 

lock.l start - offset; /* byte offset, relative to l whence */ 
lock.l, whence - whence; /* SEEK SET, SEEK CUR, SEEK END */ 
lock.l len = len; /* #bytes (0 means to EOF) */ 


return(fcntl(fd, cmd, &lock)); 





14-5 ”加 锁 或 解锁 一 个 文件 区 域 的 函数 


因为 大 多 数 锁 调 用 是 加 锁 或 解锁 一 个 文件 区 域 〈 命 令 了 _GETLK 很 少 使 用 ?， 故 通常 使 用 下 列 
5 个 宏 中 的 一 个 ， 这 5 个 宏 都 定义 在 apue .h P CHIR BO. 


$define read lock(fd,offset,whence,len) \ 

lock reg((fd), YF SETLK, F RDLCK, (offset), (whence), (len)) 
#define readw lock(fd,offset,whence,len) \ 

lock reg((fd), F SETLKW, F RDLCK, (offset), (whence), (len)) 
&define write lock(fd,offset,whence,len) \ 

lock reg((fd), F.SETLK, F WRLCK, (offset), (whence), (len)) 
$define writew lock(fd,offset,whence,len) \ 

lock reg((fd), F SETLKW, F WRLCK, (offset), (whence), (len)) 
tdefine un lock(fd,offset,whence,len) \ 

lock reg((fd), F SETLK, F UNLCK, (offset), (whence), (len)) 


我 们 有 目的 地 用 与 1 seek 函数 同样 的 顺序 定义 了 这 些 宏 中 的 前 3 个 参数 。 = 


“SE: BA ie 
14-6 中 定义 了 一 个 函数 lock test, 我 们 将 用 它 测试 一 把 锁 。 





include "apue.h" 
#include «fcntl.h» 


pid t 
lock test(int fd, int type, off t offset, int whence, off t len) 


{ 
struct flock lock; 


lock.l type = type; /* F RDLCK or F WRLCK */ 

lock.l start = offset; /* byte offset, relative to 1l whence */ 
lock.l whence = whence; /* SEEK SET, SEEK CUR, SEEK END */ 
lock.l len = len; /* #bhytes (0 means to EOF) */ 
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if (fcntl(fd, F GETLK, &lock) < 0) 
err sys("fcntl error"); 


if (lock.l type -- F UNLCK) 
returní0); /* false, region isn't locked by another proc */ 
return(lock.l pid); /* true, return pid of lock owner */ 


14-6. ”测试 一 个 锁 条 件 的 函数 
如 果 存 在 一 把 锁 ， 它 阻塞 由 参数 指定 的 锁 请 求 ， 则 此 函数 返回 持 有 这 把 现 有 锁 的 进程 的 进程 


ID， 和 否则 此 函数 返回 0。 通 常用 下 面 两 个 宏 来 调用 此 函数 〈 它 们 也 定义 在 apue .h 中 )。 
#define is read lockable(fd, offset, whence, len) \ 
(lock test((fd), F RDLCK, (offset), (whence), (len)) == 0) 
#define is write lockable(fd, offset, whence, len) \ 
(lock test((fd), F WRLCK, (offset), (whence), (len)) == 0) 


注意 ， 进 程 不 能 使 用 lock test 函数 测试 它 自己 是 否 在 文件 的 某 一 部 分 持 有 一 把 锁 。 
F GETLK 命令 的 定义 说 明 ， 返 回信 息 指 示 是 否 有 现 有 的 锁 阻止 调用 进程 设置 它 自己 的 锁 。 因 为 
F SETLK WI F SETLKW 命令 总 是 替换 调用 进程 现 有 的 锁 〈 若 已 存在 )， 所 以 调用 进程 决 不 会 阻塞 
在 自己 持 有 的 锁 上 ， 于 是 ，F_GETLK 命令 决 不 会 报告 调用 进程 自己 持 有 的 锁 。 e 


时 实例 : FER 


如 果 两 个 进程 相互 等 待 对 方 持 有 并 且 不 释放 《锁定 ) 的 资源 时 ， 则 这 两 个 进程 就 处 于 死 锁 状 
态 。 如 果 一 个 进程 已 经 控制 了 文件 中 的 一 个 加 锁 区 域 ， 然 后 它 又 试图 对 男 一 个 进程 控制 的 区 域 加 
锁 ， 那 么 它 就 会 休眠 ， 在 这 种 情况 下 ， 有 发 生死 锁 的 可 能 性 。 

图 14-7 所 示 的 程序 给 出 了 一 个 死 锁 的 例子 。 子 进程 对 第 0 字 节 加 锁 ， 父 进程 对 第 1 字 节 加 锁 。 然 
后 ， 它 们 中 的 每 一 个 又 试图 对 对 方 已 经 加 锁 的 字 节 加 锁 。 在 该 程序 中 使 用 了 89 节 中 介绍 的 父 进 程 和 子 


进程 同步 例 程 CTELL xxx 和 WAIT_xxx)， 以 便 每 个 进程 能 够 等 待 男 一 个 进程 获得 它 设 置 的 第 一 把 锁 。 


#include "apue.h" 
#include «fcntl.h» 


static void 
lockabyte(const char *name, int fd, off t offset) 
{ 
if (writew lock(fd, offset, SEEK SET, 1) < 0) 
err sys("$s: writew lock error", name); 
printf("*s: got the lock, byte $11dWn", name, (long longloffset); 
} 


int 

main (void) 

{ 
int fd; 
pid_t pid; 


/[* 
* Create a file and write two bytes to it. 
xf 
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if ((fd = creat("templock", FILE MODE)) « 0) 
err syS("creat error"); 

if (write(fd, "ab", 2) !- 2) 
err sys("write error"); 


TELL WAIT (); 
if ((pid = fork()) < 0) ( 
err sys("fork error"); 
) else if (pid == 0) { /* child */ 
lockabyte("child", fd, 0); 
TELL PARENT (getppid()); 
WAIT PARENT(); 
lockabyte("child", fd, 1); 
} else { /* parent */ 
lockabyte("parent", fd, 1); 
TELL CHILD (pid); 
WAIT CHILD(); 
lockabyte("parent", fd, 0); 
} 
exit (0); 


图 14-7 死 锁 检 测 实例 
运行 图 14-7 中 的 程序 得 到 ， 


$ ./a.out 

parent: got the lock, byte 1 

child: got the lock, byte 0 

parent: writew lock error: Resource deadlock avoided 

child: got the lock, byte 1 

检测 到 死 锁 时 ， 内 核 必须 选择 一 个 进程 接收 出 错 返回 。 在 本 实例 中 ,选择 了 父 进 程 ， 但 这 是 一 个 实 
现 细节 。 在 某 些 系统 上 ， 子 进程 总 是 接 到 出 错 信息 ， 在 另 一 些 系统 上 ， 父 进程 总 是 接 到 出 错 信息 。 在 某 


ER 


些 系 统 上 ， 当 试图 使 用 多 把 锁 时 ， 有 时 是 子 进 程 接 到 出 错 信 息 ， 有 时 则 是 父 进 程 接 到 出 错 信息 。 — 瞄 


3， 锁 的 隐 含 继承 和 释放 

关于 记录 锁 的 自动 继承 和 释放 有 3 条 规则 。 

(1) 锁 与 进程 和 文件 两 者 相关 联 。 这 有 两 重 含 义 : 第 一 重 很 明显 ， 当 一 个 进程 终止 时 ， 它 所 
建立 的 锁 全 部 释放 ; 第 二 重 则 不 太 明 显 ， 无 论 一 个 描述 符 何 时 关闭 ， 该 进程 通过 这 一 描述 符 引 用 
的 文件 上 的 任何 一 把 锁 都 会 释放 (这 些 锁 都 是 该 进程 设置 的 )。 这 就 意味 着 ， 如 果 执 行 下 列 4 步 : 

fdi = open (pathname, ...); 

read lock(fdl, ...); 


fd2 = dup(fdl); 
close (fd2); 


则 在 close (fd2) 后， 在 fdl 上 设置 的 锁 被 释放 。 如 果 将 dup 替换 为 open， 其 效果 也 一 样 : 


fdl = open(pathname, ...); 
read lock(fdl, ...):; 
fd2 = open(pathname, ...) 


close(fd2); 
(2) Hi fork 产生 的 子 进程 不 继承 父 进 程 所 设置 的 锁 。 这 意味 着 ， 若 一 个 进程 得 到 一 把 锁 ， 
然后 调用 fork， 那 么 对 于 父 进程 获得 的 锁 而 言 ， 子 进程 被 视 为 另 一 个 进程 。 对 于 通过 fork 从 
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父 进程 处 继承 过 来 的 描述 符 ， 子 进程 需要 调用 fcnt1 才能 获得 它 自 己 的 锁 。 这 个 约束 是 有 道理 
的 ， 因 为 锁 的 作用 是 阻止 多 个 进程 同时 写 同 一 个 文件 。 如 果子 进程 通过 fork 继承 父 进程 的 锁 ， 
则 父 进程 和 子 进程 就 可 以 同时 写 同一 个 文件 。 
(3) 在 执行 exec 后 ， 新 程序 可 以 继承 原 执行 程序 的 锁 。 但 是 注意 ， 如 果 对 一 个 文件 描述 符 设置 
了 执行 时 关闭 标志 ， 那 么 当 作 为 exec 的 一 部 分 关闭 该 文件 描述 符 时 ， 将 释放 相应 文件 的 所 有 锁 。 
4. FreeBSD 实现 
先 简要 地 观察 FreeBSD. 实现 中 使 用 的 数据 结构 。 这 会 帮助 我 们 进一步 理解 记录 锁 的 自动 继承 
和 释放 的 第 一 条 规则 :， 锁 与 进程 和 文件 两 者 相关 联 。 
考虑 一 个 进程 ， 它 执行 下 列 语句 〈 忽 略 出 错 返 回 )。 
fdl = open(pathname, ...); 
write lock(fdl, 0, SEEK SET, 1); /* parent write locks byte 0 */ 
if ((pid = fork()) > 0) { /* parent */ 
fd2 = dup(fdl); 
fd3 = open{pathname, ...); 
} else if (pid == 0) { 
read lock(fdl, 1, SEEK SET, 1); /* child read locks byte 1 */ 
) 


pause(); 


14-8 显示 了 父 进程 和 子 进程 暂停 GAST pause 02 后 的 数据 结构 情况 。 
SERS RA 


文件 状态 标志 
当前 文件 偏 移 量 
v 节点 指针 


文件 状态 标志 
当前 文件 偏 移 量 
v 节点 指针 





图 14-8 ”关于 记录 锁 的 FreeBSD 数据 结构 
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前 面 已 经 给 出 了 open. fork 以 及 dup 调用 后 的 数据 结构 〈 见 图 3-9 和 图 8-2)。 有 了 记录 
WE. 在 原来 的 这 些 图 上 新 加 了 lockt 结构 ,它们 由 i 节点 结构 开始 相互 链接 起 来 。 每 个 lockf 
结构 描述 了 一 个 给 定 进 程 的 一 个 加 锁 区 域 〈( 由 偏 移 量 和 长 度 定 义 的 )。 图 中 显示 了 两 个 lockf & 
构 ， 一 个 是 由 父 进程 调用 write_lock 形成 的 ， 另 一 个 则 是 由 子 进程 调用 read lock 形成 的 。 
每 一 个 结构 都 包含 了 相应 的 进程 D. 
在 父 进程 中 ,关闭 fdl1、fq2 或 fd3 中 的 任意 一 个 都 将 释放 由 父 进程 设置 的 写 锁 。 在 关闭 这 
3 个 描述 符 中 的 任意 一 个 时 ， 内 核 会 从 该 描述 符 所 关联 的 i 节点 开始 ， 逐 个 检查 1ockf 链接 表 中 
的 各 项 ， 并 释放 由 调用 进程 持 有 的 各 把 锁 。 内 核 并 不 清楚 (也 不 关心 ) 父 进程 是 用 这 3 个 描述 中 
的 哪 一 个 来 设置 这 把 锁 的 。 


f 实例 
在 图 13-6 所 示 的 程序 中 , 我 们 了 解 到 ， 守护 进程 可 用 一 把 文件 锁 来 保证 只 有 该 守护 进程 的 唯 
一 副本 在 运行 。 图 14-9 展示 了 lockfile 函数 的 实现 ， 守 护 进程 可 用 该 函数 在 文件 上 加 写 锁 。 


#include <unistd.h> 
#include «fcntl.h» 


int 
lockfile(int fd) 
{ 
struct flock f1; 


fl.l type = F_WRLCK; 

fl.l start = 0; 

fl.l whence = SEEK SET; 

fl.l len = 0; 

return(fentl(fd, F SETLK, &f1)); 


14-9 ”在 文件 整体 上 加 一 把 写 锁 
另 一 种 方法 是 用 write lock 函数 定义 lockfile HR. 
#define lockfile(fd) write lock((fd), 0, SEEK SET, 0) . 


5. 在 文件 尾 端 加 锁 

在 对 相对 于 文件 尾 端 的 字 节 范 围 加 锁 或 解锁 时 需要 特别 小 心 。 大 多 数 实 现 按照 1 whence 
的 SEEK CUR 或 SEEK END f, HH 1 start 以 及 文件 当前 位 置 或 当前 长 度 得 到 绝对 文件 偏 移 
E. 但是， 常常 需要 相对 于 文件 的 当前 长 度 指定 一 把 锁 , 但 又 不 能 调用 fstat 来 得 到 当前 文件 
长 度 ， 因 为 我 们 在 该 文件 上 没有 锁 。( 在 fstat 和 锁 调 用 之 间 ， 可 能 会 有 另 一 个 进程 改变 该 文 
件 长 度 。) 

考虑 以 下 代码 序列 ; 

writew lock(fd, 0, SEEK END, 0); 

write(fd, buf, 1); 

un lock(fd, 0, SEEK END); 

write(fd, buf, 1); 


该 代码 序列 所 做 的 可 能 并 不 是 你 所 期 望 的 。 它 得 到 一 把 写 锁 ， 该 写 锁 从 当前 文件 尾 端 起 ， 包 括 以 
后 可 能 追加 写 到 该 文件 的 任何 数据 。 假定, 该 文件 偏 移 量 处 于 文件 尾 端 时 , 执行 第 一 个 write， 
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这 个 操作 将 文件 延伸 了 1 个 字 节 ， 而 该 字 节 将 被 加 锁 。 跟 随 其 后 的 是 解锁 操作 ， 其 作用 是 对 以 
后 追加 写 到 文件 上 的 数据 不 再 加 锁 。 但 在 其 之 前 刚 追 加 写 的 一 个 字 节 则 保留 加 锁 状态 。 当 执行 
第 二 个 写 时 ， 文 件 尾 端 又 延伸 了 1 个 字 节 ， 但 该 字 节 并 未 加 锁 。 由 此 代码 序列 造成 的 文件 锁 状 态 


如 图 14-10 所 示 。 
| E met 
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————Ó——M—— 
1 

| 一 : 追加 写 入 的 | MSAK 
第 二 个 write 之 后 的 文件 状态 第 一 个 字 节 | 第 二 个 字 节 
L 
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14-10 文件 区 域 锁 

当 对 文件 的 一 部 分 加 锁 时 ， 内 核 将 指定 的 偏 移 量 变换 成 绝对 文件 偏 移 量 。 另 外 ， 除 了 指定 一 个 
绝对 偏 移 量 (SEEK SET) 之 外 ，fcnt1 还 允许 我 们 相对 于 文件 中 的 某 个 点 指定 该 偏 移 量 ， 这 个 点 
是 指 当前 偏 移 量 (SEEK_CUR) 或 文件 尾 端 (SEEK_END)。 当 前 偏 移 量 和 文件 尾 端 可 能 会 不 断 变 化 ， 
而 这 种 变化 又 不 应 影响 现 有 锁 的 状态 ， 所 以 内 核 必须 独立 于 当前 文件 偏 移 量 或 文件 屁 端 而 记 住 锁 。 

如 果 想 解除 的 锁 中 包括 第 一 次 write FEN 1 个 字 节 ， 那 么 应 指定 长 度 为 -1。 负 的 长 度 值 
表示 在 指定 偏 移 量 之 前 的 字 节 数 。 

6， 建 议 性 锁 和 强制 性 锁 

考虑 数据 库 访 问 例 程 库 。 如 果 该 库 中 所 有 函数 都 以 一 致 的 方法 处 理 记录 锁 ， 则 称 使 用 这 些 函 
数 访问 数据 库 的 进程 集 为 合作 进程 (cooperating process)。 如 果 这 些 函 数 是 唯一 地 用 来 访问 数据 
库 的 函数 ， 那 么 它们 使 用 建议 性 锁 是 可 行 的 。 但 是 建议 性 锁 并 不 能 阻止 对 数据 库 文 件 有 写 权 限 的 
任何 其 他 进程 写 这 个 数据 库 文 件 。 不 使 用 数据 库 访 问 例 程 库 协 同一 致 的 方法 来 访问 数据 库 的 进程 
是 非 合 作 进 程 。 

强制 性 锁 会 让 内 核 检查 每 一 个 open. read 和 write， 验 证 调用 进程 是 否 违背 了 正在 访问 
的 文件 上 的 某 一 把 锁 。 强 制 性 锁 有 时 也 称 为 强 迪 方式 锁 〈enforcement-mode locking). 


从 图 14-2 中 可 以 看 出 ，Linux 3.2.0 和 Solaris 10 提供 强制 性 记录 锁 ， 而 FreeBSD 8.0 和 Mac OS X 
10.6.8 则 不 提供 。 强 制 性 记录 锁 不 是 Single UNIX Specification 的 组 成 部 分 。 在 Linux 中 ， 如 果 用 户 
想 要 使 用 强制 性 锁 ， 则 需要 在 各 个 文件 系统 基础 上 用 mount 命令 的 -o mand 选项 来 打开 该 机 制 。 


对 一 个 特定 文件 打开 其 设置 组 ID 位 、 关 闭 其 组 执行 位 便 开启 了 对 该 文件 的 强制 性 锁 机 制 ( 回 
忆 图 4-12)。 因 为 当 组 执行 位 关闭 时 ， 设 置 组 ID 位 不 再 有 意义 ， 所 以 SVR3 的 设计 者 借用 两 者 的 
这 种 组 合 来 指定 对 一 个 文件 的 锁 是 强制 性 的 而 非 建议 性 的 。 

如 果 一 个 进程 试图 读 (read) RS (write) 一 个 强制 性 锁 起 作用 的 文件 ， 而 欲 读 、 写 的 部 
分 又 由 其 他 进程 加 上 了 锁 ， 此 时 会 发 生 什 么 呢 ? 对 这 一 问题 的 回答 取决 于 3 方面 的 因素 :; 操作 类 
型 (read 或 write)、 其 他 进程 持 有 的 锁 的 类 型 〈 读 锁 或 写 锁 ) 以 及 read BE write 的 描述 符 
是 阻塞 还 是 非 阻塞 的 。 图 14-11 列 出 了 8 种 可 能 性 。 


A 
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14-11 强制 性 锁 对 其 他 进程 的 read 和 write 的 影响 


除了 图 14-11 中 的 read 和 write 函数 ， 另 一 个 进程 持 有 的 强制 性 锁 也 会 对 open 函数 产生 
影响 。 通 常 ， 即 使 正在 打开 的 文件 具有 强制 性 记录 锁 ， 该 open 也 会 成 功 。 随 后 的 read 或 write 
依从 于 图 14-11 中 所 示 的 规则 。 但 是 ， 如 果 欲 打开 的 文件 具有 强制 性 记录 锁 〈 读 锁 或 写 锁 )， 而 且 
open 调用 中 的 标志 指定 为 O_TRUNC 或 0_CREAT, 则 不 论 是 否 指定 0O_NONBLOCK, open 都 立即 
HREL, errno 设置 为 EAGAIN。 


只 有 Solaris 对 O CREAT 标志 处 理 为 出 错 。 当 打开 一 个 具 强 制 性 锁 的 文件 时 ，Linux 允许 指定 
O CREAT 标志 。 对 O0 TRUNC 标志 产生 open 出 错 是 有 意义 的 ， 因 为 对 于 一 个 文件 来 讲 ， 若 另 一 
个 进 程 持 有 它 的 读 锁 或 写 锁 ， 那 么 它 就 不 能 被 截 短 为 0。 但 是 对 O_CREAT 标志 在 返回 时 设置 出 错 
”就 没什么 意义 了 ， 因 为 该 标志 表示 ， 只 有 在 该 文件 不 存在 时 才 创 建 ， 但 由 于 另 一 个 进程 持 有 该 文 
件 的 记录 锁 ， 所 以 该 文件 肯定 是 存在 的 。 


这 种 open 的 锁 冲 突 处 理 方式 可 能 会 导致 令 人 惊异 的 结果 。 在 开发 本 节 习 题 的 时 候 ， 我 们 曾 
编写 过 一 个 测试 程序 ， 它 打开 一 个 文件 〈 其 模式 指定 为 强制 性 锁 )， 对 该 文件 整体 设置 一 把 读 锁 ， 
然后 休眠 一 段 时 间 。 (回忆 图 14-11， 读 锁 应 当 阻止 其 他 进程 写 该 文件 .) 在 这 段 休眠 时 间 内 ， 用 
某 些 典型 的 UNIX 系统 程序 和 操作 符 对 该 文件 进行 处 理 ， 发 现下 列 情况 。 

© 可 用 ed 编辑 器 对 该 文件 进行 编辑 操作 , 而且 编 辑 结 果 可 以 写 回 磁盘 ! 强制 性 记录 锁 根本 

不 起 作用 。 用 某 些 UNIX 系统 版 本 提供 的 系统 调用 跟踪 特性 ， 对 ea 操作 进行 跟踪 分 析 发 
现 ，ed 将 新 内 容 写 到 一 个 临时 文件 中 ， 然 后 删除 原文 件 ， 最 后 将 临时 文件 名 改 为 原文 件 
名 。 强 制 性 锁 机 制 对 unlink 函数 没有 影响 ， 于 是 这 一 切 就 发 生 了 。 


在 FreeBSD 8.0 和 Solaris 10 中 ， 用 truss(1) 命 令 可 以 得 到 一 个 进程 的 系统 调用 跟踪 信 
$, Linux 32.0 出 于 相同 的 目的 提供 了 strace(l]1) 命 令 。Mac OS X 10.6.8 提供 了 dtruss(Im) 
命令 来 追踪 系统 调用 ， 但 该 命令 的 使 用 需要 超级 用 户 的 权限 。 


。 不 能 用 vi 编辑 器 编辑 该 文件 。vi 可 以 读 该 文件 的 内 容 ， 但 是 如 果 试 图 将 新 的 数据 写 到 
该 文件 中 ， 就 会 出 错 返回 〈EAGRAIN)。 如 果 试 图 将 新 数据 追加 写 到 该 文件 中 ， 则 write 
HÆ. vi 的 这 种 行为 与 我 们 所 希望 的 一 样 。 
e 使 用 Korn shell 的 > 和 >> 操 作 符 重 写 或 追加 写 该 文件 ， 会 产生 出 误 信息 “cannot create”. 
。 在 Bourne shell 下 使 用 > 操作 符 也 会 出 错 ， 但 是 使 用 >> 操 作 符 时 只 阻塞 ， 在 解除 强制 性 锁 后 会 
继续 进行 处 理 。( 这 两 种 shell 在 执行 追加 写 操作 时 之 所 以 会 产生 的 差异 ， 是 因为 Kom shell 以 
O CREAT 和 0O_APPEND 标志 打开 文件 ， 而 上 面 已 提 及 指定 O_CREAT 会 产生 出 错 返回 。 但 是 ， 
Bourne shell 在 该 文件 已 存在 时 并 不 指定 O_CRERAT， 所 以 open 成 功 , 而 下 一 个 write 则 阻塞 。》 
产生 的 结果 随 所 用 操作 系统 版 本 的 不 同 而 不 同 。 从 这 样 一 个 习题 中 可 见 ， 在 使 用 强制 性 锁 时 
还 需 有 所 警惕 。 从 ed 实例 可 以 看 到 ， 强 制 性 锁 是 可 以 设法 避 开 的 。 
一 个 恶意 用 户 可 以 使 用 强制 性 记录 锁 ， 对 大 家 都 可 读 的 文件 加 一 把 读 锁 ， 这 样 就 能 阻止 任何 
人 写 该 文件 (当然 ， 该 文件 应 当 是 强制 性 锁 机 制 起 作用 的 ， 这 可 能 要 求 该 用 户 能 够 更 改 该 文件 的 
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权限 位 )。 考 虑 一 个 数据 库 文件 ， 它 是 大 家 都 可 读 的 ， 并 且 是 强制 性 锁 机 制 起 作用 的 。 如 果 一 个 
恶意 用 户 要 对 整个 这 个 文件 持 有 一 把 读 锁 ， 其 他 进程 就 不 能 再 写 该 文件 。 


PE 
14-12 中 的 程序 可 以 用 于 确定 -一 个 系统 是 否 支持 强制 性 锁 机 制 。 


f#finclude "apue.h" 
#include <errno.h> 
#include «fcntl.h» 
#include «sys/wait.h» 





int 
main(int argc, char *argv[]) 


{ 


int fd; 497 
pid t pid; 

char buf[5]; 

struct stat statbuf: 


if (argc != 2) ( 
fprintf(stderr, "usage: $s filename\n", argv[0]); 
exit(1); 


if ((fd = open(argv[1}], O_RDWR | O CREAT | O TRUNC, FILE MODE)) < 0) 
err sys("open error"); 

if (write(fd, "abcdef", 6) !- 6) 
err sys("write error"); 


/* turn on set-group-ID and turn off group-execute */ 

if (fstat(fd, &statbuf) < 0) 
err sys("fstat error"); 

if (fchmod(fd, (statbuf.st mode & -S IXGRP) | S ISGID) < 0) 
err sys("fchmod error"); 


TELL WAIT(); 


if ((pid = fork0) < 0) { 
err sys("fork error"); 
} else if (pid > 0) | /* parent */ 
/* write lock entire file */ 
if (write lock(fd, 0, SEEK SET, 0) < 0) 
err Sys("write lock error"); 


TELL_CHILD (pid); 
if (waitpid(pid, NULL, 0) < 0) 
err_sys ("waitpid error"); 
} else ( /* child */ 
WAIT PARENT () ; /* wait for parent to set lock */ 


set fl(fd, O NONBLOCK); 


/* first let's see what error we get if region is locked */ 
if (read lock(fd, 0, SEEK SET, 0) !- -1)/* no wait */ 
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err sys("child: read lock succeeded"); 
printf("read lock of already-locked region returns %d\n", 
errno); 


/* now try to read the mandatory locked file */ 
if (lseek(fd, 0, SEEK SET) == -1) 
err Sys("lseek error"); 
if (read(fd, buf, 2) < 0) 
err ret("read failed (mandatory locking works)"); 
else 
printf("read OK (no mandatory locking), buf = $2.2sMn", 
buf); 
} 
exit(0); 


14-12 ”确定 是 否 支 持 强制 性 锁 


此 程序 首先 创建 一 个 文件 ， 并 使 强制 性 锁 机 制 对 其 起 作用 。 然 后 程序 分 出 一 个 父 进程 和 一 个 
子 进程 。 父 进程 对 整个 文件 设置 一 把 写 锁 ， 子 进程 则 先 将 该 文件 的 描述 符 设 置 为 非 阻 塞 的 ， 然 后 
企图 对 该 文件 设置 一 把 读 锁 ， 我 们 期 望 这 会 出 错 返 回 ， 并 希望 看 到 系统 返回 是 EACCES 或 
EAGAIN。 接 着 ， 子 进程 将 文件 读 、 写 位 置 调整 到 文件 起 点 ， 并 试图 读 (read) 该 文件 。 如 果 系 
统 提供 强制 性 锁 机 制 ， 则 read 应 返回 EACCES 或 EAGAIN (因为 该 描述 符 是 非 阻塞 的 )， 否 则 
read 返回 所 读 的 数据 。 在 Solaris 10 上 运行 此 程序 〈 该 系统 支持 强制 性 锁 机 制 )， 得 到 ， 


S ./a.out temp.lock 
read lock of already-locked region returns 11 
read failed (mandatory locking works): Resource temporarily unavailable 


查看 系统 头 文件 或 1ntro(2) 手 册页 ， 可 以 看 到 errno fü 11 对 应 于 EAGAIN. #4 FreeBSD 8.0 
运行 此 程序 ， 则 得 到 : 
$ ./a.out temp.lock 


read lock of already locked region returns 35 
read OK (no mandatory locking), buf - ab 


Hth, errno (E35 对 应 于 EAGAIN。 该 系统 不 支持 强制 性 锁 。 a 


里 实例 


让 我 们 回 到 本 节 的 第 一 个 问题 : 当 两 个 人 同时 编辑 同一 个 文件 时 将 会 怎样 呢 ? 一般 的 UNIX 
系统 文本 编辑 器 并 不 使 用 记录 锁 ， 所 以 对 此 问题 的 回答 仍然 是 : 该 文件 的 最 后 结果 取决 于 写 该 文 
件 的 最 后 一 个 进程 。 

某 些 版 本 的 vi 编辑 器 使 用 建议 性 记录 锁 。 即 使 我 们 使 用 这 种 版 本 的 vi 编辑 器 ,， 它 仍然 不 能 
阻止 其 他 用 户 使 用 另 一 个 没有 使 用 建议 性 记录 锁 的 编辑 器 。 

车 系统 提供 强制 性 记录 锁 ， 那 么 我 们 可 以 修改 自己 常用 的 编辑 器 来 使 用 它 〈 如 果 我 们 有 该 纺 
辑 器 的 源 代 码 )。 如 果 没 有 该 编辑 器 的 源 代码 ， 那 么 可 以 试 一 试 下 述 方法 。 编 写 一 个 vi 的 前 端 程 
序 。 该 程序 立即 调用 fork， 然 后 父 进程 只 等 竺 子 进程 完成 。 子 进程 打开 在 命令 行 中 指定 的 文件 ， 
使 强制 性 锁 起 作用 ， 对 整个 文件 设置 一 把 写 锁 ， 然 后 执行 vi. (E vi 运行 时 ， 该 文件 是 加 了 写 锁 
的 ， 所 以 其 他 用 户 不 能 修改 它 。 当 vi 结束 时 ， 父 进程 从 wait 返回 ， 自 编 的 前 端 程序 结束 。 

虽然 可 以 编写 这 种 类 型 的 小 型 前 端 程序 ， 但 它 却 不 起 作用 。 问 题 出 在 大 多 数 编辑 器 读 它们 的 
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输入 文件 ， 然 后 关闭 它 。 只 要 引用 被 编辑 文件 的 描述 符 关 闭 了 ， 那 么 加 在 该 文件 上 的 锁 就 被 释放 
了 。 这 意味 着 ， 在 编辑 器 读 了 该 文件 的 内 容 后 ， 随 即 关闭 了 该 文件 ， 那 么 锁 也 就 不 存在 了 。 这 个 
前 端 程 序 中 没有 任何 方法 可 以 阻止 这 一 点 。 a 


在 第 20 章 中 ， 我 们 将 使 用 数据 库 函数 库 中 的 记录 锁 来 提供 多 个 进程 的 并 发 访问 。 我 们 还 将 
提供 一 些 时 间 测 量 ， 以 观察 记录 锁 对 进程 的 影响 。 


14.4 1/0 多 路 转 接 


当 从 一 个 描述 符 读 ， 然 后 又 写 到 另 一 个 描述 符 时 ， 可 以 在 下 列 形 式 的 循环 中 使 用 阻塞 IO: 


while {(n=read(STDIN_FILENO, buf, BUFSIZ)) > 0} 
if (write(STDOUT FILENO, buf, n) !- n) 
err sys("write error"); 


这 种 形式 的 阻塞 VO 到 处 可 见 。 但 是 如 果 必 须 从 两 个 描述 符 读 ， 又 将 如 何 呢 ? 在 这 种 情况 下 ， 
我 们 不 能 在 任 一 个 描述 符 上 进行 阻塞 读 (read)， 否 则 可 能 会 因为 被 阻塞 在 一 个 描述 符 的 读 操 作 
上 而 导致 另 一 个 描述 符 即使 有 数据 也 无 法 处 理 。 所 以 为 了 处 理 这 种 情况 需要 另 一 种 不 同 的 技术 。 

让 我 们 观察 telnet(1) 命 令 的 结构 。 该 程序 从 终端 〈 标 准 输入 ) 读 ， 将 所 得 数据 写 到 网 络 连 
接 上 , 同时 从 网 络 连接 读 , 将 所 得 数据 写 到 终端 上 (标准 输出 )。 在 网 络 连 接 的 另 一 端 , telnetd 
守护 进程 读 用 户 键入 的 命令 ， 并 将 所 读 到 的 送 给 shell， 这 如 同 用 户 登录 到 远程 机 器 上 一 样 。 
telnetd 守护 进程 将 执行 用 户 键入 命令 而 产生 的 输出 通过 telnet 命令 送 回 给 用 户 ， 并 显示 在 
用 户 终端 上 。 图 14-13 显示 了 这 种 工作 情景 。 


elne elnetd 
图 14-13 telnet 程序 概观 
telnet 进程 有 两 个 输入 ， 两 个 输出 。 我 们 不 能 对 两 个 输入 中 的 任 一 个 使 用 阻塞 read， 因 
为 我 们 不 知道 到 底 哪 一 个 输入 会 得 到 数据 。 
处 理 这 种 特殊 问题 的 一 种 方法 是 , 将 一 个 进程 变 成 两 个 进程 (用 fork), 每 个 进程 处 理 一 条 数据 
通路 。 图 14-14 中 显示 了 这 种 安排 。(System V 的 uucp 通信 和 包 提 供 了 cu(1) 命 令 ， 其 结构 与 此 相似 ,) 


telnet 命令 
£ elnetd 
CTH) 
图 14-14 ”使 用 两 个 进程 实现 telnet 程序 

如 果 使 用 两 个 进程 ， 则 可 使 每 个 进程 都 执行 阻塞 read。 但 是 这 也 产生 了 问题 ， 操 作 什 么 时 候 终 
1E? 如 果子 进程 接收 到 文件 结束 符 Ccelneta 守护 进程 使 网 络 连接 断 开 )， 那 么 该 子 进程 终止 ， 然 后 
父 进程 接收 到 SIGCHLD 信和 号。 但 是 ， 如 果 父 进程 终止 〈 用 户 在 终端 上 键入 了 文件 结束 符 )， 那 么 父 
进程 应 通知 子 进程 停止 。 为 此 可 以 使 用 一 个 信号 〈 如 SIGUSR1)， 但 这 使 程序 变 得 更 加 复杂 。 


我 们 可 以 不 使 用 两 个 进程 ， 而 是 用 一 个 进程 中 的 两 个 线程 。 虽 然 这 避免 了 终止 的 复杂 性 ， 但 
却 要 求 处 理 两 个 线程 之 间 的 同步 ， 在 复杂 性 方面 这 可 能 会 得 不 偿 失 。 
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另 一 个 方法 是 仍旧 使 用 一 个 进程 执行 该 程序 ， 但 使 用 非 阻塞 VO 读 取 数 据 。 其 基本 思想 是 : 
将 两 个 输入 描述 符 都 设置 为 非 阻 塞 的 ， 对 第 一 个 描述 符 发 一 个 read。 如 果 该 输入 上 有 数据 ， 则 
读数 据 并 处 理 它 。 如 果 无 数据 可 读 ， 则 该 调用 立即 返回 。 然 后 对 第 二 个 描述 符 作 同样 的 处 理 。 在 
此 之 后 ， 等 待 一 定 的 时 间 〈 可 能 是 若干 秒 )， 然 后 再 尝试 从 第 一 个 描述 符 读 。 这 种 形式 的 循环 称 
为 轮 询 。 这 种 方法 的 不 足 之 处 是 浪费 CPU 时 间 。 大 多 数 时 间 实 际 上 是 无 数据 可 读 , 因此 执行 read 
系统 调用 浪费 了 时 间 。 在 每 次 循环 后 要 等 多 长 时 间 再 执行 下 一 轮 循 环 也 很 难 确 定 。 虽 然 轮 询 技术 
在 支持 非 阻塞 VO 的 所 有 系统 上 都 可 使 用 ， 但 是 在 多 任务 系统 中 应 当 避 免 使 用 这 种 方法 。 

还 有 一 种 技术 称 为 异步 VO Casynchronous VO)。 利 用 这 种 技术 ， 进 程 告诉 内 核 ， 当 描述 符 准 
备 好 可 以 进行 VO 时 ， 用 一 个 信号 通知 它 。 这 种 技术 有 两 个 问题 。 首 先 ， 尽 管 一 些 系统 提供 了 各 
自 的 受 限 形式 的 异步 VO, 但 POSIX 采纳 了 另外 一 套 标 准 化 接口 , 所 以 可 移植 性 成 为 一 个 问题 (以 
前 ，POSIX 异步 IO 是 Single UNIX Specification 中 是 可 选 设施 ， 但 现在 ， 这 些 接口 在 SUSv4 中 
是 必需 的 )。System V 提供 了 SIGPOLL 信和 号 来 支持 受 限 形式 的 异步 VO， 但 是 仅 当 描 述 符 引 用 
STREAMS 设备 时 ， 此 信和 号 才 起 作用 。BSD 有 一 个 类 似 的 信号 SIGIO， 但 也 有 类 似 的 限制 : DU 
描述 符 引 用 终端 设备 或 网 络 时 它 才 能 起 作用 。 

这 种 技术 的 第 二 个 问题 是 ， 这 种 信号 对 每 个 进程 而 言 只 有 1 个 (SIGPOLL 或 SIGIO)。 如 果 
使 该 信号 对 两 个 描述 符 都 起 作用 在 我 们 正在 讨论 的 实例 中 ， 从 两 个 描述 符 读 )， 那 么 进程 在 接 到 
此 信号 时 将 无 法 判别 是 哪 一 个 描述 符 准 备 好 了 。 尽管 POSIX.1 异步 VO 接口 允许 选择 哪个 信号 作为 
通知 ， 但 能 用 的 信和 号 数量 仍 远 小 于 潜在 的 打开 文件 描述 符 的 数量 。 为 了 确定 是 哪 一 个 描述 符 准备 好 
了 ， 仍 需 将 这 两 个 描述 符 都 设置 为 非 阻塞 的 ， 并 顺序 尝试 执行 TD。 我 们 将 在 14.5 节 讨 论 异步 VO. 

一 种 比较 好 的 技术 是 使 用 VO 多 路 转 接 (LO multiplexing)。 为 了 使 用 这 种 技术 ， 先 构造 一 张 
我 们 感 兴趣 的 描述 符 《〈 通 常 都 不 止 一 个 ) 的 列表 ， 然 后 调用 一 个 函数 ， 直 到 这 些 描述 符 中 的 一 个 
已 准备 好 进行 LO 时 ， 该 函数 才 返 回 。poll、pselect 和 select 这 3 个 函数 使 我 们 能 够 执行 
VO 多 路 转 接 。 在 从 这 些 函 数 返回 时 ， 进 程 会 被 告知 哪些 描述 符 已 准备 好 可 以 进行 VO. 


POSIX 指定 ， 为 了 在 程序 中 使 用 select， 必 须 包 括 <sys/select.h>。 但 较 老 的 系统 还 要 
” 求 包括 <sys/types.h>、<sys/time.h> 和 <unistd.h>。 查 看 select 手册 页 可 以 型 清楚 你 
的 系统 都 支持 什么 。 
VO 多 路 转 接 在 4.2BSD 中 是 用 select 函数 提供 的 。 虽然 该 了 区 数 主要 用 于 终端 LO 和 网 络 VO, 
但 它 对 其 他 描述 符 同样 是 起 作用 的 。SVR3 在 增加 STREAMS 机 制 时 增加 了 poll 函数 。 但 在 SVR4 
之 前 ，poll 只 对 STREAMS 设备 起 作用 。SVR4 支持 对 任意 描述 符 起 作用 的 pollo 


14.4.1 Hi select 和 pselect 


在 所 有 POSIX 兼容 的 平台 上 ，select 函数 使 我 们 可 以 执行 VO 多 路 转 接 。 传 给 select 的 
参数 告诉 内 核 : 

© 我 们 所 关心 的 描述 符 ; 

© 对 于 每 个 描述 符 我 们 所 关心 的 条 件 〈 是 否 想 从 一 个 给 定 的 描述 符 读 ， 是 否 想 写 一 个 给 定 

的 描述 符 ， 是 否 关 心 一 个 给 定 描述 符 的 异常 条 件 ); 

e 愿意 等 待 多 长 时 间 ( 可 以 永远 等 待 、 等 待 一 个 固定 的 时 间或 者 根本 不 等 待 )。 

从 select 返回 时 ， 内 核 告诉 我 们 : 

。 已 准备 好 的 描述 符 的 总 数量 ， 
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e 对 于 读 、 写 或 异常 这 3 个 条 件 中 的 每 一 个 ， 哪 些 描 述 符 已 准备 好 。 
使 用 这 种 返回 信息 ， 就 可 调用 相应 的 IO 函数 (一 般 是 read 或 write)， 并 且 确 知 该 卫 数 
不 会 阻塞 。 


finclude <sys/select.h> 


int select(int maxfdp!, fd set *restrict readfds, 
fd set *restrict wrilefds, fd set *restrict exceptfds, 
struct timeval *restrict fyptr); 





返回 值 ， 准 备 就 绪 的 描述 符 数目 ， 若 超时 ， 返 回 0; 
先 来 说 明 最 后 一 个 参数 ， 它 指定 愿意 等 待 的 时 间 长 度 ， 单 位 为 秒 和 微 秒 〈 回 忆 420 节 )。 有 
以 下 3 种 情况 。 

tvptr == NULL 
永远 等 待 。 如 果 捕 捉 到 一 个 信号 则 中 断 此 无 限期 等 待 。 当 所 指定 的 描述 符 中 的 一 个 已 准备 好 或 
捕捉 到 一 个 信号 则 返回 。 如 果 捕 捉 到 一 个 信号 ， 则 select 返回 -1，errno REA EINTR. 

tvptr-»ty sec == 0 && tvptr->tv_usec == 0 
根本 不 等 待 。 测 试 所 有 指定 的 描述 符 并 立即 返回 。 这 是 轮 询 系统 找到 多 个 描述 符 状态 而 
不 阻塞 select MAHDI. 

typtr->ty_sec != 0 || tvptr-5tv usec != 0 
等 待 指 定 的 秒 数 和 微 秒 数 。 当 指定 的 描述 符 之 一 已 准备 好 ， 或 当 指 定 的 时 间 值 已 经 超过 
时 立即 返回 。 如 果 在 超时 到 期 时 还 没有 一 个 描述 符 准 备 好 ， 则 返回 值 是 0。( 如 果 系 统 不 
提供 微 秘 级 的 精度 ， 则 tvptr->tv_usec 值 取 整 到 最 近 的 支持 值 。〉 与 第 一 种 情况 一 样 ， 这 
种 等 待 可 被 捕捉 到 的 信号 中 断 。 
| POSIX.1 允许 实现 修改 timeval 结构 中 的 值 ， 所 以 在 select 返回 后 ， 你 不 能 指望 该 结构 仍旧 保 
HHA select 之 前 它 所 包含 的 值 。FreeBSD 8.0, Mac OS X 10.6.8 和 Solaris 10 都 保持 该 结构 中 的 值 不 
变 。 但 是 ， 若 在 超时 时 间 尚 未 到 期 时 ，select 就 返回 ， 那 么 Linux 3.2.0 将 用 剩余 时 间 值 更 新 该 结构 。 


中 间 3 个 参数 readfds、writefds 和 exceptfas 是 指向 描述 符 集 的 指针 。 这 3 个 描述 符 集 说 明了 
我 们 关心 的 可 读 、 可 写 或 处 于 异常 条 件 的 描述 符 集合 。 每 个 描述 符 集 存储 在 一 个 fd_set 数据 类 
型 中 。 这 个 数据 类 型 是 由 实现 选择 的 ， 它 可 以 为 每 一 个 可 能 的 描述 符 保持 一 位 。 我 们 可 以 认为 它 
只 是 一 个 很 大 的 字 节 数组 ， 如 图 14-15 所 示 。 
fdO íd1 fd2 


ee E 


he 一 一 一 每 个 可 能 的 描述 符 一 个 位 一 — 


ee 


[——————— fd set 数据 类 型 一 一 一 一 一 | 


-DT 


14-15 对 select 指定 读 、 写 和 异常 条 件 描述 符 
对 于 fd set 数据 类 型 ， 唯 一 可 以 进行 的 处 理 是 ， 分 配 一 个 这 种 类 型 的 变量 ， 将 这 种 类 型 的 
一 个 变量 值 赋 给 同类 型 的 另 一 个 变量 ， 或 对 这 种 类 型 的 变量 使 用 下 列 4 个 函数 中 的 一 个 。 
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#include <sys/select.h> 


int FD ISSET(int fd, fd set */fdset) ; 


返回 值 : 者 应 在 描述 符 集中 ， 返 回 非 0 值 ， 否 则 ， 返 回 0 


void FD CLR(int fd, fd set *fdset); 


void FD SET(int fd, fd set *fdset); 





void FD ZERO(fd set *fdset); 


这 些 接口 可 实现 为 宏 或 函数 。 调 用 FD ZERO 将 一 个 fà set 变量 的 所 有 位 设置 为 0。 要 开启 
描述 符 集 中 的 一 位 , 可 以 调用 FD SET. 调用 FD CLR 可 以 清除 一 位 。 最 后 ， 可 以 调用 FD_ISSET 
测试 描述 符 集中 的 一 个 指定 位 是 否 已 打开 。 

在 声明 了 一 个 描述 符 集 之 后 ,必须 用 ED ZERO 将 这 个 描述 符 集 置 为 0, 然后 在 其 中 设置 我 们 
关心 的 各 个 描述 符 的 位 。 具 体操 作 如 下 所 示 : 

fd set rset; 

int fd; 

FD ZERO(&rset); 


FD SET(fd, &rset); 
FD SET(STDIN FILENO, &rset); 


从 select 返回 时 ， 可 以 用 FD ISSET 测试 该 集中 的 一 个 给 定位 是 否 仍 处 于 打开 状态 ; 


if (FD ISSET(fd, &rset)) { 


} 


select 的 中 间 3 个 参数 〈 指 向 描述 符 集 的 指针 ) 中 的 任意 一 个 【或 全 部 ) 可 以 是 空 指针 ， 
这 表示 对 相应 条 件 并 不 关心 。 如 果 所 有 3 个 指针 都 是 NULL， 则 select 提供 了 比 sleep 更 精确 
的 定时 器 。( 回 忆 10.19 节 ，sleep 等 待 整 数秒 ， 而 select 的 等 待 时 间 则 可 以 小 于 1 秒 ， 其 实 
际 精度 取决 于 系统 时 钟 。) 习题 14.5 给 出 了 这 样 一 个 函数 。 

select 第 一 个 参数 maxfap1 的 意思 是 “最 大 文件 描述 符 编 号 值 加 1”。 考 虑 所 有 3 个 描述 符 
集 ， 在 3 个 描述 符 集中 找 出 最 大 描述 符 编 号 值 ， 然 后 加 1， 这 就 是 第 一 个 参数 值 。 也 可 将 第 一 个 参数 
设置 为 FD_SETSIZE， 这 是 <sys/select.h> 中 的 一 个 常量 ， 它 指定 最 大 描述 符 数 〈 经 常 是 1024)， 
但 是 对 大 多 数 应 用 程序 而 言 ， 此 值 太 大 了 。 确 实 ， 大 多 数 应 用 程序 只 使 用 3 一 10 个 描述 符 〈 某 些 应 用 
程序 需要 更 多 的 描述 符 ， 但 这 种 UNIX 程序 并 不 典型 )。 通 过 指定 我 们 所 关注 的 最 大 描述 符 ， 内 核 就 
只 需 在 此 范围 内 寻找 打开 的 位 ， 而 不 必 在 3 个 描述 符 集中 的 数 百 个 没有 使 用 的 位 内 搜索 。 

例如 ， 图 14-16 所 示 的 两 个 描述 符 集 的 情况 就 好 像 是 执行 了 下 述 操作 : 

fd set readset, writeset; 


FD ZERO(&readset); 

FD ZERO(&writeset); 

FD SET(0, &readset); 

FD SET(3, &readset); 

FD SET(1, &writeset); 

FD SET(2, &writeset); 

selectí(4, &readset, &writeset, NULL, NULL): 


因为 描述 符 编号 从 0 开始 ， 所 以 要 在 最 大 描述 符 编 号 值 上 加 1。 第 一 个 参数 实际 上 是 要 检查 
的 描述 符 数 〈 从 描述 符 0 开始 )。 
select 有 3 个 可 能 的 返回 值 。 
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fd0 fdl fd2 fd3 


~ 一 > 这 以 后 的 位 都 没有 检查 





readset: 





writeset: 





maxfdpi = 4 
14-16 select 的 样本 描述 符 集 

CD 返回 值 -1 表示 出 错 。 这 是 可 能 发 生 的 , 例如 ， 在 所 指定 的 描述 符 一 个 都 没准 备 好 时 捕 提 
到 一 个 信号 。 在 此 种 情况 下 ， 一 个 描述 符 集 都 不 修改 。 

(2) 返回 值 0 表示 没有 描述 符 准备 好 。 若 指定 的 描述 符 一 个 都 没准 备 好 ， 指 定 的 时 间 就 过 了 ， 
那么 就 会 发 生 这 种 情况 。 此 时 ， 所 有 描述 符 集 都 会 置 0。 

(3) 一 个 正 返 回 值 说 明了 已 经 准备 好 的 描述 符 数 。 该 值 是 3 个 描述 符 集中 已 准备 好 的 描述 符 
数 之 和 , 所 以 如 果 同 一 描述 符 已 准备 好 读 和 写 ， 那么 在 返回 值 中 会 对 其 计 两 次 数 。 在 这 种 情况 下 ， 
3 个 描述 符 集中 仍旧 打开 的 位 对 应 于 已 准备 好 的 描述 符 。 

对 于 “准备 好 ”的 含义 要 作 一 些 更 具体 的 说 明 。 

e EIIE Geadfas? 中 的 一 个 描述 符 进 行 的 read 操作 不 会 阻塞 , 则 认为 此 描述 符 是 准备 好 的 。 

e. ANSE (writefas) 中 的 一 个 描述 符 进 行 的 write 操作 不 会 阻塞 ， 则 认为 此 描述 符 是 准备 好 的 。 

© 若 对 异常 条 件 集 Cexceptfds) 中 的 一 个 描述 符 有 一 个 未 决 异常 条 件 ， 则 认为 此 描述 符 是 准 

备 好 的 。 现 在 ， 异 常 条 件 包括 : 在 网 络 连接 上 到 达 带 外 的 数据 ， 或 者 在 处 于 数据 包 模 式 
的 伪 终 端 上 发 生 了 某 些 条 件 。(Stevens[1990] 的 15.10 节 中 描述 了 后 一 种 条 件 。) 

e 对 于 读 、 写 和 异常 条 件 ， 普 通 文件 的 文件 描述 符 总 是 返回 准备 好 。 505 

—AS HR FE E EH E select 是 否 阻 塞 ， 理 解 这 一 点 很 重要 。 也 就 是 说 ， 如 果 希 望 读 
一 个 非 阻塞 描述 符 ， 并 且 以 超时 值 为 5 秒 调用 select, W select 最 多 阻塞 Ss。 相 类 似 ， 如 果 指 
定 一 个 无 限 的 超时 值 ， 则 在 该 描述 符 数据 准备 好 ， 或 捕捉 到 一 个 信号 之 前 ，select 会 一 直 阻 塞 。 

如 果 在 一 个 描述 符 上 碰 到 了 文件 尾 端 , 则 select 会 认为 该 描述 符 是 可 读 的 。 然后 调用 read. 
它 返 回 0， 这 是 UNIX 系统 指示 到 达 文 件 尾 端的 方法 。( 很 多 人 错误 地 认为 ， 当 到 达 文 件 尾 端 时 ， 
select 会 指示 一 个 异常 条 件 。) 

POSIX.1 也 定义 了 一 个 select 的 变 体 ， 称 为 pselect。 


#include <sys/select.h> 









int pselect (int maxfdpi, fd set *restrict readfds, 
fd set *restrict writefds, fd set *restrict exceptfds, 
const struct timespec *restrict ispir, 
const sigset t *restrict sigmask); 


返回 值 : 准备 就 绪 的 描述 符 数目 ， 若 超时 ， 返 回 0， 若 出 错 ， 返 回 -1 


除 下 列 几 点 外 ，pselect 5 select 相同 。 

e select 的 超时 值 用 timeval 结构 指定 ， 但 pselect 使 用 timespec 结构 (回忆 4.2 
节 中 timespec 结构 的 定义 )。timespec 结构 以 秒 和 纳 秒 表示 超时 值 ， 而 非 秒 和 微 秒 。 
如 果 平 台 支 持 这 样 的 时 间 精 度 ， 那 么 timespec 就 能 提供 更 精准 的 超时 时 间 。 
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* pselect 的 超时 值 被 声明 为 const， 这 保证 了 调用 pselect 不 会 改变 此 值 。 

。 pselect 可 使 用 可 选 信号 屏蔽 字 。 若 sigmask 为 NULL， 那 么 在 与 信号 有 关 的 方面 ， 
pselect 的 运行 状况 和 select 相同 。 否 则 ，sigmask 指向 一 信号 屏蔽 字 ， 在 调用 
pselect 时 ， 以 原子 操作 的 方式 安装 该 信号 屏蔽 字 。 在 返回 时 ， 恢 复 以 前 的 信号 屏蔽 字 。 


14.4.2 ”函数 poll 


poll 函数 类 似 于 select， 但 是 程序 员 接 口 有 所 不 同 。 虽 然 poll 函数 是 System V 引入 进 
来 支持 STREAMS 子 系统 的 ， 但 是 poll 函数 可 用 于 任何 类 型 的 文件 描述 符 。 


#include «poll.h» 


int poll(struct pollfd fdarray[], nfds t nfds, int timeout); 
返回 值 ， 准 备 就 绪 的 描述 符 数 目 ， 若 超时 ， 返 回 0， 若 出 错 ， 返 回 -1 
与 select 不 同 ，pol1 不 是 为 每 个 条 件 〈 可 读 性 、 可 写 性 和 异常 条 件 〉 构造 一 个 描述 符 集 ， 
而 是 构造 一 个 pollfd 结构 的 数组 ， 每 个 数组 元 素 指定 一 个 描述 符 编号 以 及 我 们 对 该 描述 符 感 兴 
趣 的 条 件 。 





struct pollfd { 
int fd; /* file descriptor to check, or < 0 to ignore */ 
short events;  /* events of interest on fd */ 
short revents; /* events that occurred on fd */ 


i 
fdarray 数组 中 的 元 素数 由 nfds 指定 。 


由 于 历史 原因 ， 在 如 何 声明 nfds 参数 方面 有 几 种 不 同 的 方式 。SVR3 将 nfds 的 类 型 指定 为 

“unsigned long， 这 似乎 是 太 大 了 。 在 SVR4 手册 [AT&T 1990d] F, poll 原型 的 第 二 个 参数 的 

数据 类 型 为 size_t ( 见 图 2-21 中 的 基本 系统 数据 类 型 ) 但 在 <poLI.h> 包 含 的 实际 原型 中 ， 第 

二 个 参数 的 数据 类 型 仍 指定 为 unsigned long.Single UNIX Specification 定 义 了 新 类 型 nfds_t， 

， 该 类 型 允许 实现 选择 对 其 合适 的 类 型 并 且 隐藏 了 应 用 细节 。 注 意 ， 因 为 返回 值 表 示 数 组 中 满足 事 
” 件 的 项 数 ， 所 以 这 种 类 型 必须 大 得 足以 保存 一 个 整数 。 

对 应 于 SVR4 的 SVID[AT&T 1989] 上 显示 ，poll 的 第 一 个 参数 是 struct pollfd 
fdarray|], 9» SVR4 手册 页 [AT&T 1990d] 上 则 显示 该 参数 为 struct pollfd *fdarray。 在 C 语 
言 中 ， 这 两 种 声明 是 等 价 的 。 我 们 使 用 第 一 种 声明 是 为 了 重申 fdarray 指向 的 是 一 个 结构 数组 ， 
而 不 是 指向 单个 结构 的 指针 。 


应 将 每 个 数组 元 素 的 events 成 员 设 置 为 图 14-17 中 所 示 值 的 一 个 或 几 个 ， 通 过 这 些 值 告诉 
内 核 我 们 关心 的 是 每 个 描述 符 的 哪些 事件 。 返 回 时 ，revents 成 员 由 内 核 设 置 ， 用 于 说 明 每 个 描 
RARE TOLER. CHER, poll 没有 更 改 events MA. KH select 不 同 ，select 修改 
其 参数 以 指示 哪 一 个 描述 符 已 准备 好 了 。) 

14-17 中 的 前 4 行 测试 的 是 可 读 性 ， 接 下 来 的 3 行 测试 的 是 可 写 性 ， 最 后 3 行 测试 的 是 异 
常 条 件 。 最 后 3 行 是 由 内 核 在 返回 时 设置 的 。 即 使 在 events 字段 中 没有 指定 这 3 个 值 ， 如 果 相 
应 条 件 发 生 ， 在 revents 中 也 会 返回 它们 。 


有 些 poll 事件 的 名 字 中 包含 BAND, CRA STREAMS 当中 的 优先 级 波段 。 想 要 了 解 关 
于 STREAMS 和 优先 级 波段 的 更 多 信息 ， 可 以 查看 Rago[1993]。 
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POLLIN 可 以 不 阻塞 地 读 高 优先 级 数据 以 外 的 数 
据 ( 等 效 于 POLLRDNORM | POLLRDBAND) 

POLLRDNORM 可 以 不 阻塞 地 读 普通 数据 

POLLRDBAND 可 以 不 阻塞 地 读 优 先 级 数据 

POLLPRI 可 以 不 阻塞 地 读 高 优先 级 数据 





















POLLOUT 可 以 不 阻塞 地 写 普 通 数 据 
POLLWRNORM 与 POLLOUT 相同 
POLLWRBAND 可 以 不 阻塞 地 写 优先 级 数据 


POLLERR 已 出 错 
POLLHUP 已 挂 断 
POLLNVAL 描述 符 没有 引用 一 个 打开 文件 
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当 一 个 描述 符 被 挂 断 (POLLHUP) 后 ， 就 不 能 再 写 该 描述 符 ， 但 是 有 可 能 仍然 可 以 从 该 描述 
符 读 取 到 数据 。 
poll 的 最 后 一 个 参数 指定 的 是 我 们 愿意 等 待 多 长 时 间 。 如 同 select 一 样 ， 有 3 种 不 同 的 情形 。 
timeout == 一 | 
永远 等 待 。( 某 些 系统 在 <stropts .h> 中 定义 了 常量 INFTIM， 其 值 通常 是 -1。)〉 当 所 指 
定 的 描述 符 中 的 一 个 己 准 备 好 , 或 捕捉 到 一 个 信号 时 返回 。 如 果 捕 捉 到 一 个 信和 号， 则 poll 
返回 -1，errno 设置 为 EINTR。 
timeout == 0 
不 等 待 。 测 试 所 有 描述 符 并 立即 返回 。 这 是 一 种 轮 询 系统 的 方法 ， 可 以 找到 多 个 描述 符 
的 状态 而 不 阻塞 poll BR. 
timeout > 0 
等 待 timeout 毫秒 。 当 指定 的 描述 符 之 一 已 准备 好 ， 或 timeout 到 期 时 立即 返回 。 如 果 timeout 
到 期 时 还 没有 一 个 描述 符 准备 好 ， 则 返回 值 是 0。( 如 果 系 统 不 提供 毫秒 级 精度 ， 则 timeout 
值 取 整 到 最 近 的 支持 值 。) 
理解 文件 尾 端 与 挂 断 之 间 的 区 别 是 很 重要 的 。 如 果 我 们 正 从 终端 输入 数据 ， 并 键入 文件 
结束 符 ， 那 么 就 会 打开 POLLIN， 于 是 我 们 就 可 以 读 文件 结束 指示 (read 返回 0)。revents 
中 的 POLLHUP 没有 打开 。 如果 正 在 读 调制 解 调 器 , 并 且 电 话 线 已 挂 断 , 我 们 将 接 到 POLLHUP 
通知 。 
与 select 一 样 ， 一 个 描述 符 是 否 阻 塞 不 会 影响 poll LAME. 
select 和 poll 的 可 中 断 性 
中 断 的 系统 调用 的 自动 重启 是 由 4.2BSD 引入 的 〈 见 10.5 节 )， 但 当时 select 函数 是 不 重 
启 的 。 这 种 特性 在 大 多 数 系统 中 一 直 延 续 了 下 来 ， 即 使 指定 了 SA RESTART 选项 也 是 如 此 。 但 是 ， 
在 SVR4 上 ， 如 果 指 定 了 SA_RESTART, ASA select fl poll 也 是 自动 重启 的 。 为 了 在 将 软件 
移植 到 SVR4 派生 的 系统 上 时 阻止 这 一 点 ， 如 果 信 号 有 可 能 会 中 断 select R poll: MEH 
signal intr 函数 (RA 10-19). 


; 本 书 说 明 的 各 种 实现 在 接 到 一 信号 时 都 不 重启 动 poll 和 select， 即 便 使 用 了 SA RESTART 
| 标志 也 是 如 此 。 
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14.5 异步 |/O 


使 用 上 一 节 说 明 的 select HI poll 可 以 实现 异步 形式 的 通知 。 关 于 描述 符 的 状态 ， 系 统 并 
不 主动 告诉 我 们 任何 信息 ， 我 们 需要 进行 查询 〈 调 用 select B poll). WE% 10 章 中 所 述 ， 
信号 机 构 提 供 了 一 种 以 异步 形式 通知 某 种 事件 已 发 生 的 方法 。 由 BSD 和 System V 派生 的 所 有 系 
统 都 提供 了 某 种 形式 的 异步 VO, 使 用 一 个 信号 (在 System V 中 是 SIGPOLL, 在 BSD 中 是 SIGIO) 
通知 进程 ， 对 某 个 描述 符 所 关心 的 某 个 事件 已 经 发 生 。 我 们 在 前 面 的 章节 中 提 到 过 ， 这 些 形式 的 异 
步 Vo 是 受 限制 的 ， 它 们 并 不 能 用 在 所 有 的 文件 类 型 上 ， 而 且 只 能 使 用 一 个 信号 。 如 果 要 对 一 个 以 
上 的 描述 符 进行 异步 W/O， 那么 在 进程 接收 到 该 信号 时 并 不 知道 这 一 信号 对 应 于 哪 一 个 描述 符 。 

SUSv4 中 将 通用 的 异步 VO 机 制 从 实时 扩展 部 分 调整 到 基本 规范 部 分 。 这 种 机 制 解决 了 这 些 
陈旧 的 异步 VO 设施 存在 的 局 限 性 。 

在 我 们 了 解 使 用 异步 VO 的 不 同方 法 之 前 ， 需 要 先 讨 论 一 下 成 本 。 在 用 异步 VO 的 时 候 ， 要 
通过 选择 来 灵活 处 理 多 个 并 发 操作 ， 这 会 使 应 用 程序 的 设计 复杂 化 。 更 简单 的 做 法 可 能 是 使 用 多 
线程 ， 使 用 同步 模型 来 编写 程序 ， 并 让 这 些 线程 以 异步 的 方式 运行 。 

使 用 POSIX 异步 IO 接口 ， 会 带 来 下 列 麻烦 。 

e 每 个 异步 操作 有 3 处 可 能 产生 错误 的 地 方 : 一 处 在 操作 提交 的 部 分 ， 一 处 在 操作 本 身 的 

结果 ， 还 有 一 处 在 用 于 决定 异步 操作 状态 的 函数 中 。 

。 与 POSIX 异步 VO 接口 的 传统 方法 相 比 ， 它 们 本 身 涉 及 大 量 的 额外 设置 和 处 理 规 则 。 


} 事实 上 , 并 不 能 把 非 异 步 VO 函数 称 作 “同步 ” 的， 因为 尽管 它们 相对 于 程序 流 来 说 是 同步 的 ， 
| 但 相对 于 VO 来 说 并 非 如 此 。 回 忆 第 3 章 中 关于 同步 写 的 讨论 。 当 从 write 函数 的 调用 返回 时 ， 
写 的 数据 是 持久 的 ， 我 们 称 这 个 写 操作 为 “同步 ”的 。 也 不 能 依靠 把 传统 的 调用 归 类 为 “标准 ”的 
, VO 调用 来 区 别传 统 的 VO 函数 和 异步 VO 函数 ， 因 为 这 样 会 使 它们 和 标准 VO 库 中 的 函数 调用 相 
| 混淆 。 为 了 避免 产生 这 种 混淆 ， 本 节 中 我 们 把 read 和 write 函数 归 类 为 “传统 ”的 VO DK, 


。 从 错误 中 恢复 可 能 会 比较 困难 。 举 例 来 说 ， 如 果 提 交 了 多 个 异步 写 操作 ， 其 中 一 个 失败 
了 ， 下 一 步 我 们 应 该 怎么 做 ? 如 果 这 些 写 操作 是 相关 的 ， 那 么 可 能 还 需要 撤销 所 有 成 功 
的 写 操作 。 


14.5.1 System V 异步 IO 


在 System V 中 ,异步 VO 是 STREAMS 系统 的 一 部 分 , 它 只 对 STREAMS 设备 和 STREAMS 
管道 起 作用 。System V 的 异步 VO 信号 是 SIGPOLL. 

为 了 对 一 个 STREAMS 设备 启动 异步 TO， 需 要 调用 ioct1， 将 它 的 第 二 个 参数 (request) 
设置 成 I_SETSIG。 第 三 个 参数 是 由 图 14-18 中 的 一 个 或 多 个 常量 构成 的 整 型 值 。 这 些 常量 是 在 
<stropts.h> 中 定义 的 。 

E STREAMS 机制 相关 的 接口 在 SUSv4 中 己 被 标记 为 弃 用 ,所 以 这 里 不 讨论 它们 的 任何 细节 。 
关于 STREAMS 的 信息 详 见 Rago[1993]。 

除了 调用 ioct1 指定 产生 SIGPOLL 信号 的 条 件 以 外 ， 还 应 为 该 信号 建立 信和 号 处 理 程序 。 回 
忆 图 10-1, 对 于 SIGPOLL 的 默认 动作 是 终止 该 进程 ， 所 以 应 当 在 调用 ioctl 之 前 建立 信号 处 理 
程序 。 


S INPUT 
S RDNORM 
S RDBAND 
S BANDURG 


S HIPRI 
S OUTPUT 
S WRNORM 
S WRBAND 
S MSG 

S ERROR 
S HANGUP 
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可 以 不 阻塞 地 读 取 数据 ( 非 高 优先 级 数据 ) 

可 以 不 阻塞 地 读 取 普通 数据 

可 以 不 阻塞 地 读 取 优先 级 数据 

若 此 常量 和 S_RDBAND 一 起 指定 ， 当 我 们 可 以 不 阻塞 地 读 取 
优先 数据 时 ， 产 生 SIGURG 信和 号 而 非 SIGPOLL 


可 以 不 阻塞 地 读 取 高 优先 级 数据 

可 以 不 阻塞 地 写 普 通 数据 

与 S_OUTPUT 相同 

可 以 不 阻塞 地 写 优先 级 数据 

包含 SIGPOLL 信号 的 消息 已 经 到 达 流 头 部 
流 有 错误 

流 已 挂 起 





图 14-18 产生 SIGPOLL 信号 的 条 件 


14.5.2 BSD 异步 I/O 


在 BSD 派生 的 系统 中 ， 异 步 VO 是 信号 SIGIO 和 SIGURG HAF. SIGIO 是 通用 异步 VO 
信号 ，SIGURG 则 只 用 来 通知 进程 网 络 连 接 上 的 带 外 数据 已 经 到 达 。 

为 了 接收 SIGIO 信和 号， 需 执 行 以 下 3 步 。 

(1) 调用 signal 或 sigaction 为 SIGIO 信号 建立 信号 处 理 程序 。 

(2) 以 命令 FF_SETOWN ( 见 3.14 节 ) 调用 fcntl 来 设置 进程 ID 或 进程 组 ID， 用 于 接收 对 
于 该 描述 符 的 信号 。 

(3) 以 命令 F_SETFJL 调用 font] 设置 AsvNC 文件 状态 标志 ( 见 图 3-10)， 使 在 该 描述 符 
上 可 以 进行 异步 VO. 

第 3 步 仅 能 对 指向 终端 或 网 络 的 描述 符 执行 ， 这 是 BSD 异步 VO 设施 的 一 个 基本 限制 。 

对 于 SIGURG 信和 号， 只 需 执 行 第 1 步 和 第 2 步 。 该 信号 仅 对 引用 支持 带 外 数据 的 网 络 连接 描 
述 符 而 产生 ， 如 TCP 连接 。 


14.5.3 POSIX 异步 IO 


POSIX 异步 VO 接口 为 对 不 同类 型 的 文件 进行 异步 IO 提供 了 一 套 一 致 的 方法 。 这 些 接口 来 
自 实时 草案 标准 ， 该 标准 是 Single UNIX Specification 的 可 选项 。 在 SUSv4 中 ， 这 些 接口 被 移 到 
了 基本 部 分 中 ， 所 以 现在 所 有 的 平台 都 被 要 求 支持 这 些 接 口 。 

这 些 异步 VO 接口 使 用 AIO 控制 块 来 描述 VO 操作 。aiocb 结构 定义 了 AIO 控制 块 。 该 结 
构 至 少 包 括 下 面 这 些 字段 (具体 的 实现 可 能 还 包含 有 额外 的 字段 ): 


struct aiocb { 


int aio fildes; /* file descriptor */ 

off t aio offset; /* file offset for I/O */ 
volatile void *aio buf; /* buffer for I/O */ 

size t aio nbytes; /* number of bytes to transfer */ 
int aio reqprio; /* priority */ 

struct sigevent aio sigevent; /* signal information */ 


int aio lio opcode; /* operation for list I/O */ 
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aio fields 字段 表示 被 打开 用 来 读 或 写 的 文件 描述 符 。 读 或 写 操 作 从 aio offset 指定 
的 偏 移 量 开始 。 对 于 读 操作 ， 数 据 会 复制 到 缓冲 区 中 ， 该 缓冲 区 从 aio_buf 指定 的 地 址 开始 。 
对 于 写 操作 ， 数 据 会 从 这 个 缓冲 区 中 复制 出 来 。aio_nbytes 字段 包含 了 要 读 或 写 的 字 节 数 。 

注意 ， 异 步 VO 操作 必须 显 式 地 指定 偏 移 量 。 异 步 VO 接口 并 不 影响 由 操作 系统 维护 的 文件 
偏 移 量 。 只 要 不 在 同一 个 进程 里 把 异步 VO 函数 和 传统 VO 函数 混在 一 起 用 在 同一 个 文件 上 ， 就 不 
会 导致 什么 问题 。 同 时 值得 注意 的 是 ， 如果 使 用 异步 VO 接口 向 一 个 以 追加 模式 (使 用 O. APPENDO 
打开 的 文件 中 写 入 数据 ，AIO 控制 块 中 的 aio offset 字段 会 被 系统 忽略 。 

其 他 字段 和 传统 VO 函数 中 的 不 一 致 。 应 用 程序 使 用 aio_reqprio 字段 为 异步 VO 请 求 提示 
顺序 。 然 而 ， 系 统 对 于 该 顺序 只 有 有 限 的 控制 能 力 ， 因 此 不 一 定 能 遵循 该 提示 。aio_Lio_opcode 

[511] 字段 只 能 用 于 基于 列表 的 异步 WO， 我 们 在 稍 后 再 讨论 它 。aio_sigevent 字段 控制 ， 在 VO 事 

件 完 成 后 ， 如 何 通 知 应 用 程序 。 这 个 字段 通过 sigevent 结构 来 描述 。 


struct sigevent { 


int sigev_notify; /* notify type */ 

int sigev signo; /* signal number */ 
union Sigval sigev value; /* notify argument */ 
void (*sigev notify function) (union sigval); /* notify function */ 
pthread attr t *sigev notify attributes; /* notify attrs */ 


}? 
sigev notify 字段 控制 通知 的 类 型 。 取 值 可 能 是 以 下 3 个 中 的 一 个 。 
SIGEV NONE 异步 VO 请 求 完成 后 ， 不 通知 进程 。 
SIGEV SIGNAL ”异步 IO 请 求 完 成 后 ， 产 生 由 sigev signo 字段 指定 的 信号 。 如 果 应 用 程 
序 已 选择 捕捉 信号 ， 且 在 建立 信号 处 理 程序 的 时 候 指定 了 SA SIGINFO 标 
志 ， 那 么 该 信号 将 被 入 队 〈 如 果实 现 支 持 排队 信和 号?。 信 和 号 处 理 程序 会 传送 
给 一 个 siginfo 结构 ， 该 结构 的 si value 字段 被 设置 为 sigev_value 
(如 果 使 用 了 SA SIGINFO 标志 )。 
SIGEV THREAD MF VO 请 求 完成 时 ， 由 sigev_notify_function 字段 指定 的 函数 被 
调用 。sigev_value 字段 被 传 入 作为 它 的 唯一 参数 。 除非 sigev_notify_ 
attributes 字段 被 设 定 为 pthread 属性 结构 的 地 址 ， 且 该 结构 指定 了 一 
个 另外 的 线程 属性 ， 否 则 该 函数 将 在 分 离 状 态 下 的 一 个 单独 的 线程 中 执行 。 
在 进行 异步 VO 之 前 需要 先 初 始 化 AIO 控制 块 , 调用 aio read 函数 来 进行 异步 读 操作 , 或 
调用 aio write 函数 来 进行 异步 写 操作 。 


#include <aio.h> 


int aio read(struct aiocb *aiocb); 


int aio write(struct aiocb *aiocb); 





当 这 些 函 数 返 回 成 功 时 ， 异 步 VO 请 求 便 已 经 被 操作 系统 放 入 等 待 处 理 的 队列 中 了 。 这 些 返 
回 值 与 实际 VO 操作 的 结果 没有 任何 关系 。LO 操作 在 等 待 时 ， 必 须 注 意 确保 AIO 控制 块 和 数据 库 
缓冲 区 保持 稳定 ;它们 下 面 对 应 的 内 存 必 须 始 终 是 合法 的 ， 除 非 IO 操作 完成 ， 和 否则 不 能 被 复 用 。 

要 想 强 制 所 有 等 待 中 的 异步 操作 不 等 待 而 写 入 持久 化 的 存储 中 ， 可 以 设立 一 个 AIO 控制 块 并 

调用 aio fsync PAR. 
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#include <aio.h> 


int aio fsync(int op, struct aiocb *aiocb); 





AIO 控制 块 中 的 aio fildes PRET LD GRIMM. 如 果 op 参数 设 定 为 
oO_DSYNC， 那 么 操作 执行 起 来 就 会 像 调 用 了 fdatasync 一 样 。 否 则 ， 如 果 op 参数 设 定 为 0_SYNC， 
那么 操作 执行 起 来 就 会 像 调 用 了 fsync 一 样 。 

f& aio read 和 aio_write 函数 一 样 ， 在 安排 了 同步 时 ，aio_fsync 操作 返回 。 在 异步 
同步 操作 完成 之 前 ， 数 据 不 会 被 持久 化 。AIO 控制 块 控制 我 们 如 何 被 通知 ， 就 像 aio_read 和 
aio write 函数 一 样 。 

为 了 获知 一 个 异步 读 、 写 或 者 同步 操作 的 完成 状态 ， 需 要 调用 aio error 函数 。 


#include «aio.h» 


int aio error(const struct aiocb *aiocb); 





返回 值 为 下 面 4 种 情况 中 的 一 种 。 


0 异步 操作 成 功 完成 。 需 要 调用 aio return 函数 获取 操作 返回 值 。 
-1 对 aio error 的 调用 失败 。 这 种 情况 下 ，errno 会 告诉 我 们 为 什么 。 
EINPROGRESS ”异步 该 、 写 或 同步 操作 仍 在 等 待 。 

其 他 情况 其 他 任何 返回 值 是 相关 的 异步 操作 失败 返回 的 错误 码 。 


如 果 异 步 操作 成 功 ， 可 以 调用 aio return 函数 来 获取 异步 操作 的 返回 值 。 


#include «aio.h» 


ssize t aio returntconst struct aiocb *aiocb); 





直到 异步 操作 完成 之 前 , 都 需要 小 心 不 要 调用 aio return 函数 。 操 作 完 成 之 前 的 结果 是 未 
定义 的 。 还 需要 小 心 对 每 个 异步 操作 只 调用 一 次 aio_return。 一 旦 调用 了 该 函数 ， 操 作 系统 就 
可 以 释放 掉包 含 了 LO 操作 返回 值 的 记录 。 

如 果 aio return 函数 本 身 失 败 ， 会 返回 -1， 并 设置 errno。 其 他 情况 下 ， 它 将 返回 异步 
操作 的 结果 ， 即 会 返回 read. write 或 者 fsync 在 被 成 功 调用 时 可 能 返回 的 结果 。 

执行 VO 操作 时 ， 如 果 还 有 其 他 事务 要 处 理 而 不 想 被 IO 操作 阻塞 ,就 可 以 使 用 异步 VO. 4 
而 ， 如 果 在 完成 了 所 有 事务 时 ， 还 有 异步 操作 未 完成 时 ， 可 以 调用 aio suspend 函数 来 阻塞 进 
程 ， 直 到 操作 完成 。 


dinclude <aio.h> 


int aio suspend(const struct aiocb *const list(], int ment, 
const struct timespec *ftimeouf) ; 





返回 值 : GR, 返回 0; 若 出 错 ， 返回 -1 


aio suspend 可 能 会 返回 三 种 情况 中 的 一 种 。 如 果 我 们 被 一 个 信号 中 断 ， 它 将 会 返回 -1， 
并 将 errno 设置 为 EINTR。 如 果 在 没有 任何 VO 操作 完成 的 情况 下 ， 阻 塞 的 时 间 超 过 了 函数 中 
可 选 的 timeout 参数 所 指定 的 时 间 限 制 ， 那 么 aio suspend 将 返回 -1， 并 将 errno 设置 为 
ERAGRAIN《〈 不 想 设 置 任何 时 间 限 制 的 话 ， 可 以 把 空 指针 传 给 timeout 参数 )。 如 果 有 任何 VO 操作 完 
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HX; aio suspend 将 返回 0。 如果 在 我 们 调用 aio suspend 操作 时 ， 所 有 的 异步 IO 操作 都 已 
完成 ， 那 么 aio_suspend 将 在 不 阻塞 的 情况 下 直接 返回 。 

list 参数 是 一 个 指向 AIO 控制 块 数组 的 指针 ，nent 参数 表明 了 数组 中 的 条 目 数 。 数 组 中 的 空 
指针 会 被 跳 过 ， 其 他 条 目 都 必须 指向 已 用 于 初始 化 异步 VO 操作 的 AIO 控制 块 。 

当 还 有 我 们 不 想 再 完成 的 等 待 中 的 异步 VO 操作 时 ,可 以 尝试 使 用 aio cancel 函数 来 取消 它们 。 


#include <aio.h> . 


int aio cancel(int fd, struct aiocb *aiocb); 





返回 值 : CALO 


fd 参数 指定 了 那个 未 完成 的 异步 VO 操作 的 文件 描述 符 。 如 果 aioch 参数 为 NULL， 系 统 将 会 尝试 
取消 所 有 该 文件 上 未 完成 的 异步 VO 操作 。 其 他 情况 下 , 系统 将 尝试 取消 由 AIO 控制 块 描述 的 单个 异步 
LO 操作 。 我 们 之 所 以 说 系统 “尝试 ”取消 操作 ， 是 因为 无 法 保证 系统 能 够 取消 正在 进程 中 的 任何 操作 。 
aio cancel 函数 可 能 会 返回 以 下 4 个 值 中 的 一 个 。 
AIO ALLDONE 所 有 操作 在 尝试 取消 它们 之 前 已 经 完成 。 
AIO CANCELED 所 有 要 求 的 操作 已 被 取消 。 
AIO NOTCANCELED ”至 少 有 一 个 要 求 的 操作 没有 被 取消 。 
-1 对 aio_cancel 的 调用 失败 ， 错 误 码 将 被 存储 在 errno 中 。 
如 果 异 步 VO 操作 被 成 功 取 消 ， 对 相应 的 AIO 控制 块 调用 aio error 函数 将 会 返回 错误 
ECRANCELED。 如 果 操作 不 能 被 取消 , 那么 相应 的 AIO 控制 块 不 会 因为 对 aio cancel 的 调用 而 被 修改 。 
还 有 一 个 函数 也 被 包含 在 异步 IO 接口 当中 ， 尽 管 它 既 能 以 同步 的 方式 来 使 用 ， 又 能 以 异步 的 方 
式 来 使 用 ， 这 个 函数 就 是 1io_Listio。 该 函数 提交 一 系列 由 一 个 AIO 控制 块 列表 描述 的 VO 请 求 。 


#include <aio.h> 


int lio listio(int mode, struct aiocb *restrict const list(restrict], 


int ment, struct sigevent *restrict sigev); 


返回 值 : 若 成 功 ， 返回 0; 若 出 错 ， 返回 --1 


mode 参数 决定 了 VO 是 否 真 的 是 异步 的 。 WRZ EA LIO WAIT, lio listio Ñ 
数 将 在 所 有 由 列表 指定 的 VO 操作 完成 后 返回 。 在 这 种 情况 下 ，sigev 参数 将 被 忽略 。 如 果 mode 
参数 被 设 定 为 LIO_NOWAIT, lio listio 函数 将 在 VO 请 求 入 队 后 立即 返回 。 进 程 将 在 所 有 VO 
操作 完成 后 , 按照 sigev 参数 指定 的 , 被 异步 地 通知 。 如 果 不 想 被 通知 , 可 以 把 sigev 设 定 为 NULL。 
注意 ， 每 个 AIO 控制 块 本 身 也 可 能 启用 了 在 各 自 操 作 完 成 时 的 异步 通知 。 被 sigev 参数 指定 的 异 
步 通知 是 在 此 之 外 另 加 的 ， 并 且 只 会 在 所 有 的 VO 操作 完成 后 发 送 。 

list 参数 指向 AIO 控制 块 列 表 ， 该 列表 指定 了 要 运行 的 VO REN. nent 参数 指定 了 数组 中 
的 元 素 个 数 。AIO 控制 块 列 表 可 以 包含 NULL 指针 ， 这 些 条 目 将 被 忽略 。 

在 每 一 个 AIO 控制 块 中 ，aio_1io_opcode 字段 指定 了 该 操作 是 一 个 读 操作 (LIO_READ)、 写 操 
f£ CLIO WRITE)， 还 是 将 被 忽略 的 空 操作 (LIO_NOP)。 读 操作 会 按照 对 应 的 AIO 控制 块 被 传 给 了 
aio read 函数 来 处 理 。 类 似 地 ， 写 操作 会 按照 对 应 的 AIO 控制 块 被 传 给 了 aio_write 函数 来 处 理 。 

实现 会 限制 我 们 不 想 完 成 的 异步 VO 操作 的 数量 。 这 些 限制 都 是 运行 时 不 变量 ， 其 总 结 如 
图 14-19 Bras. 

可 以 通过 调用 sysconf 函数 并 把 name 参数 设置 为 SC IO LISTIO MAX 来 设 定 AIO. 
LISTIO MAX 的 值 。 类 似 地 ， 可 以 通过 调用 sysconf 并 把 name 参数 设置 为 .SC_AIO_MRAX KR 
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定 AIO MAX 的 值 ， 通 过 调用 sysconf 并 把 其 参数 设置 为 _SC_AIO_PRIO_DELTA_MAX 来 设 定 
AIO PRIO DELTA MAX 的 值 。 


AIO LISTIO MAX 单个 列表 VO 调用 中 的 最 大 VO 操作 数 POSIX AIO LISTIO MAX (2) 
AIO MAX 未 完成 的 异步 VO 操作 的 最 大 数目 POSIX AIO MAX (1) 
AIO PRIO DELTA MAX | 进程 可 以 减少 的 其 异步 VO 优先 级 的 最 大 值 | 0 


14-19 POSIX.1 中 的 异步 VO 运行 时 不 变量 的 值 


引入 POSIX 异步 操作 vo 接口 的 初衷 是 为 实时 应 用 提供 一 种 方法 ， 避 免 在 执行 VO 操作 时 阻 
塞 进程 。 接 下 来 就 让 我 们 来 看 一 个 使 用 这 些 接 口 的 例子 。 


am 实例 

虽然 我 们 不 会 在 本 文中 讨论 实时 编程 ， 但 因为 POSIX 异步 VO 接口 现在 是 Single UNIX 
Specification 的 基本 部 分 ,所 以 我 们 要 了 解 一 下 怎么 使 用 它们 。 为 了 对 比 异 步 VO 接口 和 相应 的 传 
Zt IO 接口 ， 我 们 来 研究 一 个 任务 ， 将 一 个 文件 从 一 种 格式 翻译 成 另 一 种 格式 。 

14-20 中 展示 的 程序 ， 使 用 20 世纪 80 年 代 流 行 的 USENET 新 闻 系 统 中 使 用 的 ROT-13 算 
法 ， 翻 译文 件 ， 该 算法 原本 用 于 将 文本 中 的 带 有 侵犯 性 的 或 者 含有 剧 透 和 笑话 笑 点 部 分 的 文本 模 
糊 化 。 该 算法 将 文本 中 的 英文 字符 a~z AZ 分 别 循环 向 右 偏 移 13 个 字母 位 移 ， 但 不 改变 其 
他 字符 。 
finclude "apue.h" 


#include <ctype.h> 
#include «fcntl.h» 









#define BSZ 4096 
unsigned char buf [BS2]; 


unsigned char 
translate (unsigned char c) 
{ 
if (isalpha(c)) ( 
if (c >= 'n') 
c -= 13; 
else if (c >= 'a') 
c += 13:; 
else if (c >= 'N') 
c -- 13; 
else 
c += 13; 
} 
return (c); 
} 


int 
main(int argc, char* argv[]) 
{ 


int ifd, ofd, i, n, nw; 


[515] 
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if (argc != 3) 
err quit("usage: rotl3 infile outfile"); 

if ((ifd = open(argv[1), O RDONLY)) < 0) 
err sys("can't open $s", argv[1]); 

if ((ofd = open(argv(2], O RDWRIO CREAT|O TRUNC, FILE MODE)) < 0) 
err SyS("can't create $s", argv(2)); 


while ((n = read(ifd, buf, BSZ)) > Q) { 
for (i = 0; i < nz i++) 
buf[i] = translate (buf[i]): 
if ((nw = write(ofd, buf, n)) != n) 1 
if (nw « O) 
err sys("write failed"); 
else 
err quit("short write (%d/%d)", nw, n): 


fsync(ofd); 
exit (0); 


14-20 用 ROT-13 翻译 一 个 文件 
程序 中 的 VO 部 分 是 很 直接 的 ， 从 输入 文件 中 读 取 一 个 块 ， 翻 译 之 ， 然 后 再 把 这 个 块 写 到 输 


出 文件 中 。 重 复 该 步骤 直到 遇 到 文件 尾 端 ，read 返回 0。 图 14-21 中 的 程序 展示 了 如 何 使 用 等 价 
的 异步 VO 函数 做 同样 的 任务 。 


#include "apue.h" 
#include <ctype.h> 
#include <fentl.h> 
#include <aioc.h> 
#include <errno.h> 


#tdefine BSZ 4096 
#define NBUF 8 


enum rwop { 


); 


UNUSED = 0, 
READ PENDING = 1, 
WRITE PENDING - 2 


struct buf { 


}; 


enum rwop op; 

int last; 
struct aiocb aiocb; 
unsigned char data[BSZ]; 


struct buf bufs[NBUF]: 
unsigned char 
translate(unsigned char c) 


{ 


/* same as before */ 





int 
main(int argc, char* argv[]) 
{ 


int ifd, ofd, i, j, n, err, numop; 
struct stat sbuf; 

const struct aiocb *aiolist [NBUF] ; 

off_t off = 0; 


if (arge != 3) 
err quit("usage: rotl3 infile outfile"); 
if ((ifd = open(argv(1], O RDONLY)) < O0) 
err sys("can't open $s", argv[1]); 
if ((ofd = open(argv(2], O RDWR|O CREAT|O TRUNC, FILE MODE)) < 0) 
err SyS("can't create ts", argvi2]); 
if (fstat(ifd, &sbuf) < 0) 
err sys("fstat failed"); 


/* initialize the buffers */ 

for (i = 0; i < NBUF; i++) { 
bufs[i].op = UNUSED; 
bufs[i].aiocb.aio buf = bufsl[i].data; 
bufs[i].aiocb.aio sigevent.sigev notify = SIGEV NONE; 
aiolist[i] = NULL; 


numop - 0; 
for (;;) { 
for (i = 0; i < NBUF; i++) { 
switch (bufs[i].op) { 
case UNUSED: 
/* 
* Read from the input file if more data 
* remains unread. 
*/ 
if (off < sbuf.st size} 1 
bufs[i].op = READ PENDING; 
bufs[i].aiocb.aio fildes = ifd; 


bufs[i].aiocb.aio offset - off; 

off += BSZ; 

iff (off >= sbuf.st_size) 
bufs[i].last = 1; 

bufs[i].aiocb.aio nbytes = BSZ; 


if (aio read(sbufs[i].aiocb) < 0) 
err sys("aio read failed"); 
aiolist[i] = &bufs[i].aiocb; 
numopt+; 
} 


break; 


case READ PENDING: 
if ((err = aio error(&bufs(i].aiocb)) == EINPROGRESS) 
continue; 
if (err != 0) { 
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if (err -- -1) 

err sys("aio error failed"); 
else 

err exit(err, "read failed"); 


/* 
* A read is complete; translate the buffer 
* and write it. 
*f 
if ((n = aio return(&bufs[i].aiocb)) < 0) 
err Sys("aio return failed"); 
if (n != BSZ && !bufs[i].last) 
err quit("short read (%d/%d)", n, BSZ); 
for (j = 0; j < n; j++) 
bufs[il.data[j] = translate(bufs[il.data[j]):; 
bufs[i].op = WRITE PENDING; 
bufs[il.aiocb.aio fildes - ofd; 
bufs{i].aiocb.aio_nbytes = n; 
if (aio write(&bufs[i].aiocb) < 0) 
err sys("aio write failed"); 
/* retain our spot in aiolist */ 
break; 


case WRITE PENDING: 
if ((err = aio error(&bufs[i].aiocb)) == EINPROGRESS) 
continue; 
if (err != 0) { 
if (err == -1) 
err_sys ("aio error failed"); 
else 
err exit(err, "write failed"); 


/* 
* A write is complete; mark the buffer as unused. 
*/ 
if ((n = aio return(&bufs[i].aiocb)) < 0) 
err Sys("aio return failed"); 
if (n != bufs[i].aiocb.aio nbytes) 
err_quit ("short write (%d/%d)", n, BSZ}; 
aiolist[i] = NULL; 
bufs[i].op = UNUSED; 
numop--; 
break; 


) 
if (numop == 0) I 
if (off >= sbuf.st size) 
break; 
) else [ 
if (aio suspend(aiolist, NBUF, NULL) < 0) 
err sys("aio suspend failed"); 
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bufs[0].aiocb.aio fildes = ofd; 

if (aio fsync(O SYNC, &bufs[0].aiocb) < 0) 
err sys("aio fsync failed"); 

exit(0); 


14-21 Hi ROT-13 和 异步 VO 翻译 一 个 文件 

注意 ， 我 们 使 用 了 8 个 缓冲 区 ， 因 此 可 以 有 最 多 8 个 异步 VO 请 求 处 于 等 待 状态 。 令 人 惊讶 
的 是 ， 实 际 上 这 可 能 会 降低 性 能 ， 因 为 如 果 读 操作 是 以 无 序 的 方式 提交 给 文件 系统 的 ， 操 作 系 统 
提前 读 的 算法 便 会 失效 。 

在 检查 操作 的 返回 值 之 前 ， 必 须 确认 操作 已 经 完成 。 当 aio_error 返回 的 值 既 非 EINPROGRESS 
亦 非 -1 时 ， 表 明 操作 完成 。 除 了 这 些 值 之 外 ， 如 果 返 回 值 是 0 以 外 的 任何 值 ， 说 明 操 作 失 败 了 。 一 
旦 检查 过 这 些 情况 ， 便 可 以 安全 地 调用 aio return 来 获取 LO 操作 的 返回 值 了 。 

只 要 还 有 事情 要 做 ， 就 可 以 提交 异步 VO 操作 。 当 存在 未 使 用 的 AIO 控制 块 时 ， 可 以 提交 一 
个 异步 读 操作 。 读 操作 完成 后 ， 翻 译 缓冲 区 中 的 内 容 并 将 它 提 交 给 一 个 异步 写 请 求 。 当 所 有 AIO 
控制 块 都 在 使 用 中 时 ， 通 过 调用 aio suspend 等 待 操 作 完 成 。 

在 把 一 个 块 写 入 输出 文件 时 ， 我 们 保留 了 在 从 输入 文件 读 取 数 据 时 的 偏 移 量 。 因 而 写 的 顺序 
并 不 重要 。 这 一 策略 仅 在 输入 文件 中 每 个 字符 和 输出 文件 中 对 应 的 字符 的 偏 移 量 相同 的 情况 下 适 
用 ， 我 们 在 输出 文件 中 既 没 有 添加 字符 也 没有 删除 字符 。 

这 个 实例 中 并 没有 使 用 异步 通知 ， 因 为 使 用 同步 编程 模型 更 加 简单 。 如 果 在 LO 操作 进行 时 
还 有 别 的 事情 要 做 ,那么 额外 的 工作 可 以 包含 在 for 循环 当中 。 然 而 ， 如 果 需 要 阻止 这 些 额 外 的 
工作 延迟 翻译 文件 的 任务 ， 那 么 就 需要 组 织 下 代码 使 用 异步 通知 。 多 任务 情况 下 ， 决 定 程序 如 何 
建构 之 前 需要 先 考虑 各 个 任务 的 优先 级 。 a 


14.6 函数 readv 和 writev 


readv 和 writev 函数 用 于 在 一 次 通 数 调用 中 读 、 写 多 个 非 连续 缓冲 区 。 有 时 也 将 这 两 个 函 
数 称 为 散布 读 〈scatter read) 和 和 聚集 写 (gather write). 
#include <sys/uio.h> 


ssize t readv(int fd, const struct iovec *iov, int iovent); 


ssize t writev(int fd, const struct iovec *iov, int iovent); 


两 个 函数 的 返回 信 ， 已 读 或 已 写 的 字 节 数 ， 若 出 错 ， 返 回 -1 
这 两 个 函数 的 第 二 个 参数 是 指向 iovec 结构 数组 的 一 个 指针 : 





struct iovec ( 

void  *iov base; /* starting address of buffer */ 

size t iov len; /* size of buffer */ 
de 
iov 数组 中 的 元 素数 由 iovcnt 指定 ， 其 最 大 值 受 限于 rov MAx (回忆 图 2-11)。 图 14-22 显示 
了 这 两 个 函数 的 参数 和 iovec 结构 之 间 的 关系 。 

writev 函数 从 缓冲 区 中 聚集 输出 数据 的 顺序 是 :ioy[0] 、iov[11] 直 至 iov [iovcnt-1] 。 

writev 返 回答 出 的 字 节 总 数 ， 通 常 应 等 于 所 有 缓冲 区 长 度 之 和 。 
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iov[0] .iov_base 
iov[0].iov len 
ioy[1].iov base 


iov[1].iov len 


iov[ tovcnt-1) .iov_base 


iov[iovcni-1].iov len 





14-22 readv Al writev 的 iovec 结构 


readv 函数 则 将 读 入 的 数据 按 上 述 辐 样 顺序 散布 到 缓冲 区 中 。readv 总 是 先 填 满 一 个 缓冲 
区 ， 然 后 再 填写 下 一 个 。readv 返回 读 到 的 字 节 总 数 。 如 果 遇 到 文件 尾 端 ， 己 无 数据 可 读 ， 则 返 
回 0。 


这 两 个 函数 始 于 4.2BSD,， BR, SVR4 也 提供 它们 。 在 Single UNIX Specification 的 XSI 
[s21] | 扩展 中 包括 了 这 两 个 函数 。 


m 实例 

在 20.8 358] db writeidx 函数 中 ， 需 将 两 个 缓冲 区 中 的 内 容 连 续 地 写 到 一 个 文件 中 。 第 
二 个 缓冲 区 是 调用 者 传递 过 来 的 一 个 参数 ， 第 一 个 缓冲 区 是 我 们 创建 的 ， 它 包含 了 第 二 个 缓冲 的 
长 度 以 及 文件 中 其 他 信息 的 文件 偏 移 量 。 有 以 下 3 种 方法 可 以 实现 这 一 要 求 。 

CD 调用 两 次 write， 每 个 缓冲 区 一 次 。 

(2) 分 配 一 个 大 到 足以 包含 两 个 缓冲 区 的 新 缓冲 区 。 将 两 个 缓冲 区 的 内 容 复 制 到 新 缓冲 区 中 。 
然后 对 这 个 新 缓冲 区 调用 一 次 write. 

(3) 调用 writev 输出 两 个 缓冲 区 。 

20.8 节 的 解决 方案 使 用 了 writev， 但 是 将 它 与 另外 两 种 方法 进行 比较 ， 对 我 们 是 很 有 启发 
的 。 图 14-23 显示 了 上 面 所 述 3 种 方法 的 结果 。 


Linux (Intel x86) Mac OS X (Intel x86) 
操作 


两 次 write . . 8.33 13.83 
inta. Rak write . i 4.87 9.25 
一 次 writev . E 5.34 9.24 


图 14-23 ”比较 writev 和 其 他 技术 所 得 的 时 间 结 果 


用 于 测量 的 测试 程序 输出 一 个 100 字 节 的 头 文件 ， 接 着 又 输出 200 字 节 的 数据 。 这 样 做 1 048 576 
次 ， 产 生 了 一 个 300 MB 的 文件 。 该 测试 程序 有 3 个 版 本 一 一 针对 图 14-23 中 的 每 一 种 测量 技术 
编写 了 一 个 版 本 。 使 用 times ( 见 8.17 节 ) 测 得 它们 在 写 操作 前 、 后 各 使 用 的 用 户 CPU 时 间 、 
系统 CPU 时 间 和 时 钟 时 间 。 这 3 个 时 间 的 单位 都 是 秒 。 

正如 我 们 所 预料 的 ， 调 用 两 次 write 的 系统 时 间 比 调用 一 次 write 或 writev 的 长 ， 这 与 
3-6 的 结果 类 似 。 

接着 要 注意 的 是 ， 在 缓冲 区 复制 后 跟随 一 个 write 所 用 的 CPU 时 间 (用 户 时 间 加 系统 时 间 ) 要 
少 于 调用 一 次 writev 所 耗费 的 CPU 时 间 。 对 于 单一 write 的 情况 ,我 们 先 将 用 户 层次 的 两 个 缓冲 
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区 复制 到 一 个 分 段 缓冲 区 (staging buffer)， 然 后 在 调用 write 时 内 核 将 该 分 段 缓冲 区 中 的 数据 
复制 到 其 内 部 缓冲 区 。 对 于 writev 的 情况 ， 因 为 内 核 只 需 将 数据 直接 复制 进 其 分 段 缓冲 区 ， 所 
以 复制 工作 应 当 会 少 一 些 。 但 是 ， 对 于 这 种 少量 数据 ， 使 用 writev 的 固定 成 本 大 于 收益 。 随 着 
需 复制 数据 的 增加 ， 程 序 中 复制 缓冲 区 的 成 本 也 会 增多 ， 此 时 ，wzritev 这 种 替代 方法 将 更 具 吸 
引力 。 


” 不 要 依据 图 14-23 中 的 数字 对 Linux 和 Mac 0SX 之 间 的 相对 性 能 作 过 多 的 推断 。 这 两 种 计算 
机 有 很 大 差别 ; 它们 有 不 同 的 处 理 器 结构 、 不 同 数 量 的 RAM 以 及 不 同 过 度 的 磁盘 。 为 了 在 操作 


， 系 统 之 间 进 行 公平 的 比较 ， 需 要 对 每 一 种 操作 系统 都 使 用 相同 的 硬件 。 s 


总 之 ， 应 当 用 尽量 少 的 系统 调用 次 数 来 完成 任务 。 如 果 我 们 只 写 少量 的 数据 ， 将 会 发 现 自 己 
复制 数据 然后 使 用 一 次 write SEH writev 更 合算 。 但 也 可 能 发 现 ， 我 们 管理 自己 的 分 段 组 
冲 区 会 增加 程序 额外 的 复杂 性 成 本 ， 所 以 从 性 能 成 本 的 角度 来 看 不 合算 。 
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管道 、FIFO 以 及 某 些 设备 〈 特 别 是 终端 和 网 络 ) 有 下 列 两 种 性 质 。 

(1) 一 次 read 操作 所 返回 的 数据 可 能 少 于 所 要 求 的 数据 ， 即 使 还 没 达 到 文件 尾 端 也 可 能 是 
这 样 。 这 不 是 一 个 错误 ， 应 当 继续 读 该 设备 。 

(2) 一 次 write 操作 的 返回 值 也 可 能 少 于 指定 输出 的 字 节 数 。 这 可 能 是 由 某 个 因素 造成 的 ， 
例如 ， 内 核 输出 缓冲 区 变 满 。 这 也 不 是 错误 ， 应 当 继 续 写 余下 的 数据 。( 通 常 ， 只 有 非 阻 塞 描述 
符 ， 或 捕捉 到 一 个 信号 时 ， 才 发 生 这 种 write 的 中 途 返 回 。) 

在 读 、 写 磁盘 文件 时 从 未 见 到 过 这 种 情况 ,除非 文件 系统 用 完了 空间 ， 或 者 接近 了 配额 限制 ， 
不 能 将 要 求 写 的 数据 全 部 写 出 。 

通常 ， 在 读 、 写 一 个 管道 、 网 络 设备 或 终端 时 ， 需 要 考虑 这 些 特性 。 下 面 两 个 函数 readn 
和 writen 的 功能 分 别 是 读 、 写 指定 的 X 字 节 数 据 ， 并 处 理 返 回 值 可 能 小 于 要 求 值 的 情况 。 这 两 
个 函数 只 是 按 需 多 次 调用 read 和 write HER. ST NEUEN. 


#include "apue.h" 


Ssize t readn(int fd, void *buf, size t nbytes); 


ssize t writen(int fd, void *buf, size t nbytes); 


PAT ARATE: wk. SSR: Fh, E- 





”类似 于 本 书 很 多 实例 所 使 用 的 出 错 处 理 例 程 ， 我 们 定义 这 两 个 函数 的 目的 是 便于 在 后 面 实例 
”中 使 用 。readn 和 writen 函数 并 不 是 哪个 标准 的 组 成 部 分 。 
在 要 将 数据 写 到 上 面 提 到 的 文件 类 型 上 时 ， 就 可 调用 writen， 但 是 仅 当 事先 就 知道 要 接收 
数据 的 数量 时 ， 才 调用 readn。 图 14-24 包含 了 readn 和 writen 的 实现 ， 在 后 面 的 实例 中 ， 
我 们 还 会 用 到 。 


#include "apue.h” 


ssize_t /* Read "n" bytes from a descriptor */ 
readn(int fd, void *ptr, size_t n) 
{ 
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size t nleft; 
ssize t nread; 


nleft - n; 
while (nleft > 0) 1 
if ((nread = read(fd, ptr, nleft)) < 0) { 
if (nleft == n) 
return(-1); /* error, return -1 */ 
else 
break; /* error, return amount read so far */ 
} else if (nread == 0) { 
break; /* EOF */ 
} 
nleft -= nread; 
ptr += nread; 
} 
return(n - nleft); /* return >= 0 */ 


} 


ssize_t /* Write "n" bytes to a descriptor */ 


writen(int fd, const void *ptr, size_t n) 
{ 


size_t nleft; 
ssize t nwritten; 
nleft = n; 


while (nleft > 0) { 
if ((nwritten = write(fd, ptr, nleft)) < 0) { 
if (nleft -- n) 
returní(-1); /* error, return -1 */ 


else 
break; /* error, return amount written so far */ 
) else if (nwritten == 0) { 
break; 
) 
nleft -- nwritten; 


ptr  *- nwritten; 
} 


return{n ~ nleft); /* return >= 0 */ 


14-24 readn 和 writen 函数 
注意 ， 若 在 已 经 读 、 写 了 一 些 数据 之 后 出 错 ， 则 这 两 个 函数 返回 的 是 已 传输 的 数据 量 ， 而 非 
错误 。 与 此 类 似 ， 在 读 时 ， 如 达到 文件 尾 端 ， 而 且 在 此 之 前 已 成 功 地 读 了 一 些 数 据 ， 但 尚未 满足 
所 要 求 的 量 ， 则 readn 返回 已 复制 到 调用 者 缓冲 区 中 的 字 节 数 。 


14.8 存储 映射 I/O 


存储 映射 VO (memory-mapped VO) 能 将 一 个 磁盘 文件 映射 到 存储 空间 中 的 一 个 缓冲 区 上 ， 
于 是 ， 当 从 缓冲 区 中 取 数 据 时 ， 就 相当 于 读 文件 中 的 相应 字 节 。 与 此 类 似 ， 将 数据 存 入 缓冲 区 时 ， 
相应 字 节 就 自动 写 入 文件 。 这 样 ， 就 可 以 在 不 使 用 read 和 write 的 情况 下 执行 IO. 
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存储 映射 VO 伴随 虚拟 符 储 系统 已 经 用 了 很 多 年 。1981 年 ，4.1BSD 以 其 vread 和 vwrite 
函数 提供 了 一 种 不 同形 式 的 存储 映射 O, 4.2BSD 中 删除 了 这 两 个 函数 ,试图 替换 成 mmap SH, 
但 是 4.2BSD 实际 上 并 没有 包含 mmap BK (RAM McKusick 等 [1996] 中 2.5 节 的 描述 ), Gingell. 
i Moran 和 Shannon[1987] 描 述 了 mmap 的 一 种 实现 。SUSv4 把 mmap 函数 从 可 选项 规范 中 移 到 了 基 
| 础 规范 中 。 所 有 的 遵循 POSIX 的 系统 都 需要 支持 它 。 


为 了 使 用 这 种 功能 ， 应 首先 告诉 内 核 将 一 个 给 定 的 文件 映射 到 一 个 存储 区 域 中 。 这 是 由 mmap 
函数 实现 的 。 


#include <sys/mman.h> 


void *mmap(void *addr, size t len, int prot, int flag, int fd, oft t off); 
返回 值 : 落成 功 ， 返 回 映 射 区 的 起 始 地 址 ; 若 出 错 ， 返 回 MAP FAILED 


addr 参数 用 于 指定 映射 存储 区 的 起 始 地 址 。 通常 将 其 设置 为 0， 这 表示 由 系统 选择 该 映射 区 
的 起 始 地 址 。 此 函数 的 返回 值 是 该 映射 区 的 起 始 地 址 。 

fd 参数 是 指定 要 被 映射 文件 的 描述 符 。 在 文件 映射 到 地 址 空间 之 前 ， 必 须 先 打开 该 文件 。len 参 
数 是 映射 的 字 节 数 ，of 是 要 映射 字 节 在 文件 中 的 起 始 偏 移 量 《有关 ofF 值 的 一 些 限制 将 在 后 面 说 明 )。 

prot 参数 指定 了 映射 存储 区 的 保护 要 求 ， 如 图 14-25 所 示 。 





PROT READ 映射 区 可 读 


PROT WRITE 映射 区 可 写 
PROT_EXEC 映射 区 可 执行 
PROT_NONE 映射 区 不 可 访问 





图 14-25 ”映射 存储 区 的 保护 要 求 
可 将 prot 参数 指定 为 PROT_NONE， 也 可 指定 为 PROT_READ、PROT_WRITE 和 PROT EXEC 
的 任意 组 合 的 按 位 或 。 对 指定 映射 存储 区 的 保护 要 求 不 能 超过 文件 open 模式 访问 权限 。 例 如 ， 
若 该 文件 是 只 读 打 开 的 ， 那 么 对 映射 存储 区 就 不 能 指定 PROT_WRITE。 
在 说 明 flag 参数 之 前 ， 先 看 一 下 存储 映射 文件 的 基本 情况 。 图 14-26 显示 了 一 个 存储 映射 文 
件 。( 见 图 7-6 中 所 示 的 典型 进程 的 存储 器 安排 。》 在 此 图 中 ,“ 起 始 地 址 ”是 mmap 的 返回 值 。 映 
射 存 储 区 位 于 堆 和 栈 之 间 : 这 属于 实现 细节 ， 各 种 实现 之 间 可 能 不 同 。 
下 面 是 flag 参数 影响 映射 存储 区 的 多 种 属性 。 
MAP_FIXED 返回 值 必须 等 于 addr。 因 为 这 不 利于 可 移植 性 ， 所 以 不 鼓励 使 用 此 标志 。 
如 果 未 指定 此 标志 ， 而 且 addr 非 0， 则 内 核 只 把 addr RAPA 
射 区 的 一 种 建议 ， 但 是 不 保证 会 使 用 所 要 求 的 地 址 。 将 addr 指定 为 0 可 
获得 最 大 可 移植 性 。 
在 遵循 POSIX 的 系统 中 , 对 MAP_FIXED 标志 的 支持 是 可 选择 的 , 但 遵循 XSI 的 系统 则 
, 和 要求 支 持 MAP. FIXED, 


MAP SHARED 这 一 标志 描述 了 本 进程 对 映射 区 所 进行 的 存储 操作 的 配置 。 此 标志 指定 
存储 操作 修改 映射 文件 ， 也 就 是 ， 存 储 操作 相当 于 对 该 文件 的 write. 
必须 指定 本 标志 或 下 一 个 标志 (MAP_PRIVATE)， 但 不 能 同时 指定 两 者 。 

MAP PRIVATE ”本 标志 说 明 ， 对 映射 区 的 存储 操作 导致 创建 该 映射 文件 的 一 个 私有 副本 。 
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所 有 后 来 对 该 映射 区 的 引用 都 是 引用 该 副本 。( 此 标志 的 一 种 用 途 是 用 于 
调试 程序 ， 它 将 程序 文件 的 正文 部 分 映射 至 存储 区 ， 但 允许 用 户 修改 其 
中 的 指令 。 任 何 修改 只 影响 程序 文件 的 副本 ， 而 不 影响 原文 件 。) 





14-26 存储 陕 射 文件 的 例子 


每 种 实现 都 可 能 还 有 另外 一 些 MAP xxx 标志 值 ， 它 们 是 那 种 实现 所 特有 的 。 详 细 情 况 请 参 
见 你 所 使 用 系统 的 mmap(2) 手 册页 。 

of WER addr AVE (如 果 指 定 了 MAP_FIXED) 通常 被 要 求 是 系统 虚拟 存储 页 长 度 的 倍数 。 
虚拟 存储 页 长 可 用 带 参 数 _SC_PAGESIZE 或 SC PAGE _ST2ZE 的 sysconf MR ( 见 2.5.4 节 ) 得 
到 。 因 为 of F addr 常常 指定 为 0， 所 以 这 种 要 求 一 般 并 不 重要 。 


| 这 一 要 求 通常 是 由 系统 实现 强加 的 。 尽 管 Single UNIX Specification 不 再 要 求 满足 该 条 件 ， 但 
是 所 有 本 书 中 讲 到 的 除了 FreeBSD 8.0 以 外 的 所 有 平台 都 满足 了 这 一 要 求 。FreeBSD 8.0 允许 我 们 
| 使 用 任意 的 地 址 对 齐 和 信 移 对 章 ， 只 要 对 章 匹 配 即 可 。 


既然 映射 文件 的 起 始 偏 移 量 受 系统 虚拟 存储 页 长 度 的 限制 ， 那 么 如 果 映 射 区 的 长 度 不 是 页 长 
的 整数 倍 时 ， 会 怎么 样 昵 ? 假定 文件 长 为 12 字 节 ， 系 统 页 长 为 512 字 节 ， 则 系统 通常 提供 512 
字 节 的 映射 区 ， 其 中 后 500 字 节 被 设置 为 0。 可 以 修改 后 面 的 这 500 字 节 ， 但 任何 变动 都 不 会 在 
文件 中 反映 出 来 。 于 是 ， 不 能 用 map 将 数据 添加 到 文件 中 。 我 们 必须 先 加 长 该 文件 ， 如 后 面 的 
14-27 中 的 程序 所 示 。 

与 映射 区 相关 的 信号 有 SIGSEGV 和 SIGBUS. 信号 SIGSEGV 通常 用 于 指示 进程 试图 访问 对 
它 不 可 用 的 存储 区 。 如 果 映 射 存储 区 被 mmap 指定 成 了 只 读 的 ， 那 么 进程 试图 将 数据 存 入 这 个 映 
射 存 储 区 的 时 候 ， 也 会 产生 此 信号。 如 果 喘 射 区 的 某 个 部 分 在 访问 时 已 不 存在 ， 则 产生 SIGBUS 
信号。 例如 ， 假 设 用 文件 长 度 映 射 了 一 个 文件 ， 但 在 引用 该 映射 区 之 前 ， 另 一 个 进程 已 将 该 文件 
截断 。 此 时 ， 如 果 进 程 试图 访问 对 应 于 该 文件 已 截 去 部 分 的 映射 区 ， 将 会 接收 到 SIGBUS 信和 号。 - 

子 进程 能 通过 fork 继承 存储 映射 区 《因为 子 进程 复制 父 进程 地 址 空间 ， 而 存储 映射 区 是 该 
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地 址 空间 中 的 一 部 分 )， 但 是 由 于 同样 的 原因 ， 新 程序 则 不 能 通过 exec 继承 存储 映射 区 。 
调用 mprotect 可 以 更 改 一 个 现 有 映射 的 权限 。 


#include <sys/mman.h> 


int mprotect (void *addr, size t lem, int prot); 





prot 的 合法 值 与 mmap 中 prot 参数 的 一 样 ( 见 图 14-250. HER, 地址 参数 addr 的 值 必须 是 
系统 页 长 的 整数 倍 。 

如 果 修 改 的 页 是 通过 MAP SHARED 标志 映射 到 地 址 空间 的 ， 那 么 修改 并 不 会 立即 写 回 到 文件 
中 。 相 反 ， 何 时 写 回 脏 页 由 内 核 的 守护 进程 决定 ， 决 定 的 依据 是 系统 负载 和 用 来 限制 在 系统 失败 
事件 中 的 数据 损失 的 配置 参数 。 因 此 ， 如 果 只 修改 了 一 页 中 的 一 个 字 节 ， 当 修改 被 写 回 到 文件 中 
时 ， 整 个 页 都 会 被 写 回 。 

如 果 共 享 映射 中 的 页 已 修改 ， 那 么 可 以 调用 msync 将 该 页 冲洗 到 被 映射 的 文件 中 。msync 
国 数 类 似 于 £sync (3.13 节 )， 但 作用 于 存储 映射 区 。 


finclude <sys/mman.h> 


int msync(void *addr, size t len, int flags); 





如 果 映 射 是 私有 的 ， 那 么 不 修改 被 映射 的 文件 。 m-——— 样 ， 地 址 必须 与 页 边 
AUNT. 

flags 参数 使 我 们 对 如 何冲 洗 存 储 区 有 某 种 程度 的 控制 。 可 以 指定 MS ASYNC 标志 来 简单 地 调 
试 要 写 的 页 。 如 果 希 望 在 返回 之 前 等 待 写 操 作 完 成 ， 则 可 指定 MS SYNC 标志 。 一 定 要 指定 
MS, ASYNC 和 MS SYNC 中 的 一 个 。 

MS INVALIDATE 是 一 个 可 选 标志 ， 人 允许 我 们 通知 操作 系统 丢弃 那些 与 底层 存储 器 没有 同步 
的 页 。 若 使 用 了 此 标志 ， 菜 些 实现 将 丢弃 指定 范围 中 的 所 有 页 ， 但 这 种 行为 并 不 是 必需 的 。 


msync 函数 包含 在 Single UNIX Specification 的 XSI 选项 中 。 因 此 ， 所 有 UNIX 系统 必须 支持 它 。 


当 进程 终止 时 ， 会 自动 解除 存储 映射 区 的 映射 ， 或 者 直接 调用 munmap 函数 也 可 以 解除 映射 
区 。 关 闭 映射 存储 区 时 使 用 的 文件 描述 符 并 不 解除 映射 区 。 


#include <sys/mman.h> 


int munmap (void *addr, size t len): 





munmap 并 不 影响 被 映射 的 对 象 ， 也 就 是 说 ， 调 用 munmap 并 不 会 使 映射 区 的 内 容 写 到 磁盘 
文件 上 。 对 于 MAP. SHARED 区 磁盘 文件 的 更 新 ， 会 在 我 们 将 数据 写 到 存储 映射 区 后 的 某 个 时 刻 ， 
按 内 核 虚拟 存储 算法 自动 进行 。 在 存储 区 解除 映射 后 , 对 MAP PRIVATE 存储 区 的 修改 会 被 丢弃 。 


at 实例 
14-27 中 的 程序 用 存储 映射 IO 复制 文件 〈 类 似 于 cp(1) 命 令 )。 
#include "apue.h" 


#include «fcntl.h» 
#include <sys/mman.h> 
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#define 


int 


COPYINCR (1024*1024*1024) /* 1 GB */ 


main(int argc, char *argv[]) 


( 


int fdin, fdout; 
void *src, *dst; 
size t copysz; 
struct stat sbuf; 

off_t fsz = 0; 


if (arge != 3) 


err quit("usage: %s <fromfile> «tofile»", argv[0]); 


if ((fdin = open(argv[1], O RDONLY)) < 0) 


err sys("can't open $s for reading", argv[1]); 


if ((fdout = open(argv[2], O_RDWR |] O CREAT | O TRUNC, 
FILE MODE)) < 0) 


err sys("can't creat $s for writing", argv[2]); 


if (fstat(fdin, &sbuf) < 0} /* need size of input file */ 


err Sys("fstat error"); 


if (ftruncate(fdout, sbuf.st size) « 0) /* set output file size */ 


err sys("ftruncate error"); 


while (fsz < sbuf.st size) { 


) 


if ((sbuf.st size - fsz) » COPYINCR) 
COpysz = COPYINCR; 

else 
copysz = sbuf.st size - fsz; 


if ((src = mmap(0, copysz, PROT READ, MAP SHARED, 
fdin, fsz)) == MAP FAILED) 
err sys("mmap error for input"); 
if ((dst = mmap(0, copysz, PROT READ | PROT WRITE, 
MAP SHARED, fdout, fsz)) -- MAP FAILED) 
err sys("mmap error for output"); 


memcpy(dst, src, copysz); /* does the file copy */ 
munmap(src, copysz): 

munmap (dst, copysz); 

fsz += copysz; 


exit (0); 


14-27 用 存储 映射 VO 复制 文件 


该 程序 首先 打开 两 个 文件 ， 然 后 调用 fstat 得 到 输入 文件 的 长 度 。 在 为 输入 文件 调用 mmap 
和 设置 输出 文件 长 度 时 都 需 使 用 输入 文件 长 度 。 可 以 调用 £truncate 设置 输出 文件 的 长 度 。 如 
果 不 设 置 输出 文件 的 长 度 ， 则 对 输出 文件 调用 mmap 也 可 以 ， 但 是 对 相关 存储 区 的 第 一 次 引用 会 
产生 SIGBUS 信号。 
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然后 对 每 个 文件 调用 mmap， 将 文件 映射 到 内 存 ， 最 后 调用 memcpy 将 输入 缓冲 区 的 内 容 复 
制 到 输出 缓冲 区 。 为 了 限制 使 用 内 存 的 量 ， 我 们 每 次 最 多 复制 1 GB 的 数据 (如 果 系 统 没有 足够 
的 内 存 ， 可 能 无 法 把 一 个 很 大 的 文件 中 的 所 有 内 容 都 映射 到 内 存 中 )。 在 映射 文件 中 的 后 一 部 分 
数据 之 前 ， 我 们 需要 解除 前 一 部 分 数据 的 映射 。 

在 从 输入 缓冲 区 (src) 取 数据 字 节 时 , 内 核 自 动 读 输入 文件 ; 在 将 数据 存 入 输出 缓冲 区 (dst) 
时 ， 内 核 自动 将 数据 写 到 输出 文件 中 。 


| 数据 被 写 到 文件 的 确切 时 间 依 赖 于 系统 的 页 管理 算法 。 某 些 系统 设置 了 守护 进程 ， 在 系统 运 
， 行 期 间 ， 它 慢 条 斯 理 地 将 改写 过 的 页 写 到 磁盘 上 。 如 果 想 要 确保 数据 安全 地 写 到 文件 中 ， 则 需 在 
: 进程 终止 前 以 MS SYNC 标志 调用 msync。 


将 存储 区 映射 复制 与 用 read 和 write 进行 的 复制 (缓冲 区 长 度 为 8 1920 相 比 较 ， 得 到 
图 14-28 中 所 示 的 结果 。 其 中 ， 时 间 单 位 是 秒 ， 被 复制 文件 的 长 度 是 300MB。 注 意 ， 我 们 并 没有 
在 退出 前 将 数据 同步 到 磁盘 。 


Linux 3.2.0 (Intel x86) Solaris 10 (SPARC) 


4] 14-28 read/write 4 mmap/memcpy 比较 的 时 间 结 果 

在 Linux 3.2.0 和 Solaris 10 中 ， 两 种 方法 的 总 的 CPU 时 间 〔〈 用 户 时 间 + 系 统 时 间 ) 几乎 是 相 
同 的 。 在 Solaris 中 ， 使 用 mmap 和 memcpy 复制 ， 与 使 用 read 和 write 相 比 ， 花 费 了 更 多 的 
用 户 时 间 ， 但 却 减少 了 系统 时 间 。 在 Linux 中 ， 用 户 时 间 的 结果 很 相似 ， 但 是 用 read 和 write 
消耗 的 系统 时 间 要 比 使 用 mmap 和 memcpy 略 好 一 些 。 这 两 种 版 本 的 方法 是 殊途同归 的 。 

二 者 的 主要 区 别 在 于 , 与 mmap M memcpy HM. read 和 write 执行 了 更 多 的 系统 调用 ， 并 
做 了 更 多 的 复制 。read 和 write 将 数据 从 内 核 缓 冲 区 中 复制 到 应 用 缓冲 区 〈read)， 然 后 再 把 数 
据 从 应 用 缓冲 区 复制 到 内 核 缓 冲 区 (write)。 而 mmap Ml memcpy 则 直接 把 数据 从 映射 到 地 址 空 
间 的 一 个 内 核 缓 冲 区 复制 到 另 一 个 内 核 缓冲 区 。 当 引用 尚 不 存在 的 内 存 页 时 ， 这 样 的 复制 过 程 就 会 作 
为 处 理 页 错误 的 结果 而 出 现 〈 每 次 错 页 读 发 生 一 次 错误 ， 每 次 错 页 写 发 生 一 次 错误 )。 如 果 系 统 调用 
和 额外 的 复制 操作 的 开销 和 页 错误 的 开销 不 同 ， 那 么 这 两 种 方法 中 就 会 有 一 种 比 另 一 种 表现 更 好 。 

在 Linux 3.2.0 中 ， 相 对 于 运行 时 间 ， 两 种 版 本 的 程序 在 时 钟 时 间 上 显示 出 了 巨大 的 差异 : 使 
用 read 和 write 的 版 本 完成 任务 比 使 用 mmap 和 memcpy 的 版 本 快 了 4 倍 。 然 而 在 Solaris 10 
中 ， 使 用 mmap 和 memcpy 的 版 本 比 使 用 read 和 write 的 版 本 要 快 。 既 然 二 者 的 CPU 时 间 几 
乎 是 相同 的 ， 为 何 它 们 的 时 钟 时 间 差 异 却 如 此 之 大 也? 一 种 可 能 是 ， 在 一 种 版 本 中 需要 较 长 的 时 
间 来 等 待 IO 完成 。 这 个 等 待 时 间 并 没有 计算 在 CPU 的 处 理 时 间 中 。 另 一 种 可 能 是 ， 某 些 系 统 
处 理 的 时 间 可 能 并 没有 在 程序 中 计算 ， 比 如 系统 守护 进程 把 页 写 到 磁盘 中 的 操作 。 由 于 需要 为 
读 和 写 分 配 页 ， 系 统 的 守护 进程 会 帮助 我 们 准备 可 用 的 页 。 如 果 页 的 写 操作 是 随机 的 而 非 连续 
的 ， 那 么 把 它们 写 入 磁盘 所 需要 的 时 间 会 更 长 ， 因此 在 页 可 以 被 用 来 复 用 之 前 所 需 等 待 的 时 间 也 
会 更 长 。 "ud 

有 的 系统 将 一 个 普通 文件 复制 到 另 一 个 普通 文件 中 时 ， 存 储 映射 VO 可 能 会 比较 快 。 但 是 有 一 
些 限 制 ， 例 如 ， 不 能 用 这 种 技术 在 某 些 设备 之 间 〈 如 网 络 设备 或 终端 设备 ) 进行 复制 ， 并 且 在 对 被 
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复制 的 文件 进行 映射 后 ， 也 要 注意 该 文件 的 长 度 是 否 改变 。 尽 管 如 此 ， 某 些 应 用 程序 仍然 能 得 益 于 
存储 映射 TO， 因 为 它 处 理 的 是 存储 空间 而 不 是 读 、 写 一 个 文件 ， 所 以 常常 可 以 简化 算法 。 从 存储 
映射 VO 中 得 益 的 一 个 例子 是 对 帧 缓冲 设备 的 操作 ， 该 设备 引用 位 图 式 显示 (bit-mapped display). 
Krieger. Stumm 和 Unrau[1992] 描 述 了 一 个 使 用 存储 映射 VO 的 标准 IO 库 ( 见 第 5 B). 
15.9 节 还 会 提 到 存储 映射 VO, 其 中 还 举 了 一 个 例子 , 说 明 如 何 使 用 存储 上 映射 IO 在 两 个 相关 
进程 间 提 供 共 享 存储 区 。 


14.9 ”小结 


本 章 描述 了 很 多 高 级 LO 功能 ， 其 中 有 许多 将 用 在 后 面 章节 的 实例 中 。 

e 非 阻塞 /OQ 一 一 发 一 个 VO 操作 ， 不 使 其 阻塞 。 

记录 锁 (在 第 20 章 中 有 一 个 实例 ， 该 实例 会 对 此 进行 更 详细 的 讨论 )。 

VO 多 路 转 接 一 一 select 和 poll 函数 【在 后 面 的 很 多 实例 中 会 用 到 这 两 个 函数 )。 
readv 和 writev 函数 (在 后 面 的 很 多 实例 中 也 会 用 到 这 两 个 函数 )。 

存储 映射 VO (mmap). 





14.1 编写 一 个 测试 程序 说 明 你 所 用 系统 在 下 列 情况 下 的 运行 情况 ， 一 个 进程 在 试图 对 一 个 文件 
的 某 个 范围 加 写 锁 的 时 候 阻塞 ， 之 后 其 他 进程 又 提出 了 一 些 相关 的 加 读 锁 请 求 。 试 图 加 写 
锁 的 进程 会 不 会 因此 而 钱 死 ? 

14.2 查看 你 所 用 系统 的 头 文件 ， 并 研究 select 和 4 个 FD 宏 的 实现 。 

14.3 系统 头 文件 通常 对 £a set 数据 类 型 可 以 处 理 的 最 大 描述 符 数 有 一 个 内 置 的 限制 ， 假 设 需 
要 将 描述 符 数 增加 到 2048， 该 如 何 实现 ? 

14.4 比较 处 理 信号 量 集 的 函数 C, 10.11 节 ) 和 处 理 £a set 描述 符 集 的 函数 ， 并 比较 这 两 类 函 
数 在 你 系统 上 的 实现 。 

14.5 用 select E poll 实现 一 个 与 sleep 类 似 的 函数 sleep_us， 不 同 之 处 是 要 等 待 指定 的 
车 干 微 秘 。 比 较 这 个 函数 和 BSD 中 的 usleep 函数 。 

14.6 是 否 可 以 利用 建议 性 记录 锁 来 实现 图 10-24 中 的 函数 TELL WAIT. TELL PARENT. 
TELL CHILD. WAIT PARENT LAR WAIT CHILD? 如 果 可 以 ， 编 写 这 些 函数 并 测试 其 功能 。 

14.7 用 非 阻塞 写 来 确定 管道 的 容量 。 将 其 值 与 第 2 章 的 PIPE_BUF 值 进行 比较 。 

14.8 重 写 图 14-21 中 的 程序 来 制作 一 个 过 滤器 : 从 标准 输入 中 读 入 并 向 标准 输出 写 , 但 是 要 使 用 
异步 IO 接口 。 为 了 使 之 能 正常 工作 ， 你 都 需要 修改 些 什 么 ? 记 住 , 无 论 你 的 标准 输出 被 连 
接 到 终端 、 管 道 还 是 一 个 普通 文件 ， 都 应 该 得 到 相同 的 结果 。 

14.9 回忆 图 14-23， 在 你 的 系统 上 找到 一 个 损益 平衡 点 ， 从 此 点 开始 ， 使 用 writev 将 快 于 你 自 
已 使 用 单个 write 复制 数据 。 

14.10 运行 图 14-27 中 的 程序 复制 一 个 文件 ， 检 查 输入 文件 的 上 一 次 访问 时 间 是 否 更 新 了 ? 

14.41. 在 图 14-27 的 程序 中 , 在 调用 mmap 后 调用 close 关闭 输入 文件 ， 以 验证 关闭 描述 符 不 会 

使 内 存 映 射 VO 失效 。 





进程 间 通 信 





15.1 引言 


第 8 章 说 明了 进程 控制 原 语 ， 并 且 观 察 了 如 何 调用 多 个 进程 。 但 是 这 些 进程 之 间 交 换 信 息 的 
叭 一 途径 就 是 传送 打开 的 文件 ， 可 以 经 由 fork 或 exec 来 传送 ， 也 可 以 通过 文件 系统 来 传送 。 
本 章 将 说 明 进 程 之 间 相 互通 信 的 其 他 技术 一 一 进程 间 通 信 CInterProcess Communication, IPC). 

过 去 ，UNIX 系统 IPC 是 各 种 进程 通信 方式 的 统称 ， 但 是 ， 这 些 通信 方式 中 极 少 有 能 在 所 有 
UNIX 系统 实现 中 进行 移植 的 。 随 着 POSIX 和 The Open Group〈 以 前 是 X/Open) 标准 化 的 推进 
和 影响 的 扩大 ， 情 况 己 得 到 改善 ， 但 差别 仍然 存在 。 图 15-1 摘要 列 出 了 本 书 讨论 的 4 种 实现 所 支 
持 的 不 同形 式 的 IPC。 


IPC 类 型 | wea | sus | FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 


Lo 
FIFO 
| | | 
命名 全 双 工 管道 废弃 的 

XSI 消息 队列 

XSI 信号 量 

XSI 共享 存储 

信号 量 . 
共享 存储 (实时 ) | SHM 选项 

Sa oel | | 101: 


15-1 UNIX 系统 IPC 摘要 

注意 ， 虽 然 Single UNIX Specification (*SUS" J) 要 求 的 是 半 双 工 管 道 ， 但 允许 实现 支持 全 
双 工 管道 。 即 使 应 用 程序 在 编写 时 假定 基础 操作 系统 只 支持 半 双 工 管道 ， 支 持 全 双 工 管道 的 实现 
也 能 用 这 种 应 用 程序 正常 工作 。 图 中 使 用 “( 全 )” 表 示 用 全 双 工 管道 支持 半 双 工 管道 的 实现 。 

在 图 15-1 中 ， 我 们 在 支持 基本 功能 的 位 置 处 标注 了 一 个 黑 点 。 对 于 全 双 工 管道 ， 如 果 该 特征 
是 经 由 UNIX REF (UNIX domain socket, J 17.2 节 ) 支持 的 ， 则 在 相应 列 中 标注 “UDS”。 
某 些 实现 用 管道 和 UNIX 域 套 接 字 来 支持 该 特征 ， 所 以 这 些 位 置 上 标 有 “*。、UDS”。 

IPC 接口 作为 POSIX.1 实时 扩展 的 一 部 分 ， 也 是 Single UNIX Specification 中 的 选项 。 在 SUSv4 
中 ， 信 和 号 量 接口 从 可 选 规范 移 到 了 基本 规范 中 。 

虽然 命名 全 双 工 管道 作为 被 挂 载 的 基于 STREAMS 的 管道 使 用 ， 但 是 Single UNIX Specification 
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将 它 标记 成 弃 用 的 。 


尽管 Linux 中 OpenSS7 项 目的 “Linux Fast-STREAMS” 包 支持 STREAMS, 但 是 这 个 包 最 近 
| 都 没有 和 更新。 从 2008 年 以 来 最 新 的 包 版 本 只 到 内 核 版 本 2.6.26。 


15-1 中 前 10 种 IPC 形式 通常 限于 同一 台 主 机 的 两 个 进程 之 间 的 PC。 最 后 两 行 〈 套 接 字 
和 STREAMS) 是 仅 有 的 支持 不 同 主机 上 两 个 进程 之 间 IPC 的 两 种 形式 。 

我 们 将 与 IPC 有 关 的 讨论 分 成 3 章 。 本 章 讨论 经 典 的 PC:， 管道 、FIFO、 消 息 队 列 、 信 和 号 量 
以 及 共享 存储 。 下 一 章 讨 论 使 用 套 接 字 机 制 的 网 络 PC。 第 17 章 说 明 IPC 的 某 些 高 级 特征 。 


15.2 管道 


管道 是 UNIX 系统 IPC 的 最 古老 形式 ， 所 有 UNIX 系统 都 提供 此 种 通信 机 制 。 管 道 有 以 下 两 
种 局 限 性 。 

CD 历史 上 ， 它 们 是 半 双 工 的 〈 即 数据 只 能 在 一 个 方向 上 流动 )。 现 在 ， 某 些 系 统 提供 全 双 
工 管道 ， 但 是 为 了 最 佳 的 可 移植 性 ， 我 们 决 不 应 预先 假定 系统 支持 全 双 工 管道 。 

(2) 管道 只 能 在 具有 公共 祖先 的 两 个 进程 之 问 使 用 。 通 常 ， 一 个 管道 由 一 个 进程 创建 ， 在 进 
程 调 用 fork 之 后 ， 这 个 管道 就 能 在 父 进程 和 子 进程 之 间 使 用 了 。 

我 们 将 会 看 到 FIFO CO, 15.5 节 ) 没有 第 二 种 局 限 性 ，UNIX 域 套 接 字 ( 见 17.2 节 ) 没有 这 
两 种 局 限 性 。 

尽管 有 这 两 种 局 限 性 ， 半 双 工 管道 仍 是 最 常用 的 IPC 形式 。 每 当 在 管道 中 键入 一 个 命令 序列 ， 
让 shell 执行 时 ，shell 都 会 为 每 一 条 命令 单独 创建 一 个 进程 ， 然 后 用 管道 将 前 一 条 命令 进程 的 标 
准 输出 与 后 一 条 命令 的 标准 输入 相连 接 。 

管道 是 通过 调用 pipe 函数 创建 的 。 


#include <unistd.h> 


int pipe(int fa[2]); 





经 由 参数 mdigIRIPIT XARA: fapo]Aris4T3T, porcine: JUHI A fap] 
的 输入 。 


最 初 在 4.3BSD 和 44BSD "P, FAAM UNIX 域 套 接 字 实现 的 。 虽 然 UNIX 域 套 接 字 默 认 是 
| 全 双 工 的 ， 但 这 些 操作 系统 阻碍 了 用 于 管道 的 套 接 字 ， 以 至 于 这 些 管 道 只 能 以 半 双 工 模式 操作 。 
| POSIX: AA ERAS RPM, MFM, AME fa AREA RATA. 


15-2 中 给 出 了 两 种 描绘 半 双 工 管道 的 方法 。 左 图 显示 管道 的 两 端 在 一 个 进程 中 相互 连接 ， 
右 图 则 强调 数据 需要 通过 内 核 在 管道 中 流动 。 
fstat 函数 (7,42 35) 对 管道 的 每 一 端 都 返回 一 个 FIFO 类 型 的 文件 描述 符 。 可 以 用 S_ISFIFO 
宏 来 测试 管道 。 
POSIX.1 规定 stat 结构 的 st_size 成 员 对 于 管道 是 未 定义 的 。 但 是 当 fstat 函数 应 用 于 
| 管道 读 端的 文件 描述 符 时 ， 很 多 系统 在 st_size 中 存储 管道 中 可 用 于 读 的 字 节 数 。 但 是 ， 这 是 不 
' 可 移植 的 。 
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用 户 进程 用 户 进程 


或 者 
fd[0]  fd[1] 


a 


AK 
图 15-2 ”描绘 半 双 工 管道 的 两 种 方法 


单个 进程 中 的 管道 几乎 没有 任何 用 处 。 通 常 ， 进 程 会 先 调用 pipe, RAWH fork, ATE 
建 从 父 进程 到 子 进程 的 IPC 通道 ， 反 之 亦 然 。 图 15-3 显示 了 这 种 情况 。 


父 进程 子 进程 






fd[1] 





f£d[0] 





内 核 
15-3 fork 之 后 的 半 双 工 管道 


fork 之 后 做 什么 取决 于 我 们 想 要 的 数据 流 的 方向 。 对 于 从 父 进程 到 子 进程 的 管道 ， 父 进程 关 
闭 管道 的 读 端 (fd [0] )， 子 进程 关闭 写 端 (fd[1] )。 图 15-4 显示 了 在 此 之 后 描述 符 的 状态 结果 。 


子 进 程 
"mag 


内 核 
图 15-4 ”从 父 进程 到 子 进程 的 管道 
对 于 一 个 从 子 进 程 到 父 进程 的 管道 ， 父 进程 关闭 fa[1] ， 子 进程 关闭 fd [0]。 
当 管 道 的 一 端 被 关闭 后 ， 下 列 两 条 规则 起 作用 。 
(D 4% (read) 一 个 写 端 已 被 关闭 的 管道 时 ， 在 所 有 数据 都 被 读 取 后 ，read 返回 0， 表 


[535] 
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示 文 件 结束 。( 从 技术 上 来 讲 ， 如 果 管 道 的 写 端 还 有 进程 ， 就 不 会 产生 文件 的 结束 。 可 以 复制 一 
个 管道 的 描述 符 ， 使 得 有 多 个 进程 对 它 具 有 写 打 开 文 件 描述 符 。 但 是 ， 通 常 一 个 管道 具有 一 个 读 
进程 和 一 个 写 进 程 。 下 一 节 介绍 FIFO 时 ， 会 看 到 对 于 单个 的 FIFO 常常 有 多 个 写 进程 。) 

(2) MAS (write) 一 个 读 端 已 被 关闭 的 管道 ， 则 产生 信和 号 STGPIPE。 如 果 忽 略 该 信号 或 
者 捕捉 该 信号 并 从 其 处 理 程 序 返 回 ， 则 write 返回 一 1|，errno 设置 为 EPIPE。 

在 写 管道 (R FIFO) 时 ， 常 量 PIPE_BUF 规定 了 内 核 的 管道 缓冲 区 大 小 。 如 果 对 管道 调用 
write， 而 且 要 求 写 的 字 节 数 小 于 等 于 PIPE_BUF， 则 此 操作 不 会 与 其 他 进程 对 同一 管道 (或 
FIFO) 的 write 操作 交叉 进行 。 但 是 ， 若 有 多 个 进程 同时 写 一 个 管道 (或 FIFO), MARNE 
求 写 的 字 节 数 超过 PIPE_BUF， 那 么 我 们 所 写 的 数据 可 能 会 与 其 他 进程 所 写 的 数据 相互 交叉 。 用 
pathconf 或 fpathconf MR CWA 2-12) 可 以 确定 PIPE BUF 的 值 。 


"实例 

图 15-5 程序 创建 了 一 个 从 父 进程 到 子 进程 的 管道 ， 并 且 父 进程 经 由 该 管道 向 子 进程 传送 数据 。 
tinclude "apue.h" 
int 


main(void) 


{ 


int n; 

int fd[2]); 

pid t pid; 

char line [MAXLINE]; 


if (pipe(fd) < 0) 
err_sys("pipe error"); 
if ((pid = fork()) < 0) { 
err sys("fork error"); 
) else if (pid » 0) ( /* parent */ 
close(f£d[0]); 
write(fd[1], "hello world\n", 12); 
) else ( /* child */ 
close(fd[1]); 
n = read(fd[0], line, MAXLINE); 
write(STDOUT FILENO, line, n); 
} 
exit (0); 


15-5 经 由 管道 从 父 进程 向 子 进 程 传送 数据 


注意 ， 这 里 的 管道 方向 和 图 15-4 中 的 是 一 致 的 。 = 

在 上 面 的 例子 中 ， 直 接 对 管道 描述 符 调 用 了 reaa 和 write。 更 有 趣 的 是 将 管道 描述 符 复制 

到 了 标准 输入 或 标准 输出 上 。 通 常 ， 子 进程 会 在 此 之 后 执行 另 一 个 程序 ， 该 程序 或 者 从 标准 输入 
(已 创建 的 管道 》 读 数据 ， 或 者 将 数据 写 至 其 标准 输出 〈 该 管道 )。 


PES. 
试 着 编写 一 个 程序 ， 其 功能 是 每 次 一 页 地 显示 已 产生 的 输出 。 已 经 有 很 多 UNIX 系统 公用 程 
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序 具有 分 页 功能 ， 因 此 无 需 再 构造 一 个 新 的 分 页 程序 ， 只 要 调用 用 户 最 喜爱 的 分 页 程序 就 可 以 了 。 
为 了 避免 先 将 所 有 数据 写 到 一 个 临时 文件 中 ， 然 后 再 调用 系统 中 有 关 程 序 显 示 该 文件 ， 我 们 希望 
通过 管道 将 输出 直接 送 到 分 页 程序 。 为 此 ， 先 创建 一 个 管道 ，fork 一 个 子 进程 ， 使 子 进程 的 标 
准 输入 成 为 管道 的 读 端 ， 然 后 调用 exec， 执 行 用 的 分 页 程序 。 图 15-6 中 的 程序 显示 了 如 何 实现 
这 些 操 作 。( 本 例 要 求 在 命令 行 中 有 一 个 参数 指定 要 显示 的 文件 的 名 称 。 通 常 ， 这 种 类 型 的 程序 
要 求 在 终端 上 显示 的 数据 已 经 在 存储 器 中 了 。) 


#include "apue.h" 
#include <sys/wait.h> 


#define DEF_PAGER "/pin/more" /* default pager program */ 
int 


main(int argc, char *argv[]) 
{ 


int n; 

int fd[2]; 

pid t pid; 

char *pager, *argv0; 
char line[MAXLINE]; 
FILE *fp; 


if (argc != 2) 
err quit("usage: a.out «pathname»"); 


if ((fp = fopen(argv[1], "r")) == NULL) 
err Sys("can't open $s", argv[11); 
if (pipe(fd) « 0) 
err sys("pipe error"); 


if ((pid = fork(}} < 0) I 
err sys("fork error"); 

) else if (pid > 0) { /* parent */ 
close (fd[0]); /* close read end */ 


/* parent copies argv[1] to pipe */ 
while (fgets(line, MAXLINE, fp) != NULL) { 
n = strlen(line); 
if (write(fd[1], line, n) != n) 
err sys("write error to pipe"); 
} 
if (ferror(fp)) 
err_sys("fgets error"); 


close(fd[1]); /* close write end of pipe for reader */ 


if (waitpid(pid, NULL, 0) < 0) 
err sys("waitpid error"); 


exit(0); 

} else f /* child */ 
close(fd[1]); /* close write end */ 
if (fd[0] != STDIN FILENO) { 


if (dup2(fd[0], STDIN FILENO) != STDIN FILENO) 
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err sys("dup2 error to stdin"); 
close(fd[0]);/* don't need this after dup2 */ 
) 


/* get arguments for execl() */ 
if ((pager = getenv("PAGER")) == NULL) 
pager - DEF PAGER; 
if ((argvO = strrchr(pager, '/')) != NULL) 
argvû++; /* step past rightmost slash */ 
else 
argv0 = pager; /* no slash in pager */ 


if (execl(pager, argvO0, (char *)0) < 0} 
err Sys("execl error for %s", pager); 
) 
exit (0); 


15-6 ”将 文件 复制 到 分 页 程序 

在 调用 fork 之 前 ， 先 创建 一 个 管道 。 调 用 fork 之 后 ， 父 进程 关闭 其 读 端 ， 子 进程 关闭 其 
写 端 。 然 后 子 进 程 调 用 dup2， 使 其 标准 输入 成 为 管道 的 读 端 。 当 执行 分 页 程序 时 ， 其 标准 输入 
将 是 管道 的 读 端 。 

将 一 个 描述 符 复 制 到 另 一 个 上 《在 子 进程 中 ，fdq[01] 复制 到 标准 输入 )， 在 复制 之 前 应 当 比 
较 该 描述 符 的 值 是 否 已 经 具有 所 希望 的 值 。 如 果 该 描述 符 已 经 具有 所 希望 的 值 , 并 且 调用 了 dup2 
和 close， 那 么 该 描述 符 的 副本 将 关闭 。( 回 忆 3.12 节 中 所 述 ， 当 dup2 中 的 两 个 参数 值 相等 时 
的 操作 。) 在 本 程序 中 ,如果 shell 没有 打开 标准 输入 ， 那 么 程序 开始 处 的 fopen 应 已 使 用 描述 符 
0, 也 就 是 最 小 未 使 用 的 描述 符 , 所 以 £d OI 决 不 会 等 于 标准 输入 。 尽 管 如 此 , 无 论 何 时 调用 dup2 
和 close 将 一 个 描述 符 复 制 到 另 一 个 上 ， 作 为 一 种 保护 性 的 编程 措施 ， 都 要 先 将 两 个 描述 符 进 
行 比 较 。 

请 注意 ， 我 们 是 如 何尝 试 使 用 环境 变量 PAGER 获得 用 户 分 页 程序 名 称 的 。 如 果 这 种 操作 没 
有 成 功 ， 则 使 用 系统 默认 值 。 这 是 环境 变量 的 常见 用 法 。 a 


ai 实例 


回忆 8.9 节 中 的 5 个 函数 ，TELL_WRIT、TELIL_ PARENT. TELL CHILD. WAIT PARENT 和 


WAIT_CHILD。 图 10-24 中 提供 了 一 个 使 用 信号 的 实现 。 图 15-7 则 提供 了 一 个 使 用 管道 的 实现 。 


#include "apue.h" 
static int pfdi[2], pfd2(2]; 


void 
TELL, WAIT (void) 
{ 
if {pipe(pfdl) < 0 || pipe(pfd2) < 0) 
err sys("pipe error"); 
} 


void 
TELL_PARENT (pid t pid) 
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if (write(pfd2[1], "c", 1) != 1) 
err sys("write error"); 


} 


void 
WAIT PARENT (void) 
( 

char c; 


if (read(pfd1[0], &c, 1) != 1) 
err sys("read error"); 


if (c != 'p') 
err quit("WAIT PARENT: incorrect data"); 
} 


void 
TELL, CHILD(pid t pid) 
{ 
if (write(pfdl[1], "p", 1) t= 1) 
err Sys("write error"); 


) 


void 
WAIT CHILD(void) 
i 


char C; 


if (read(pfd2[0], &c, 1) !- 1) 
err sys("read error"); 


if (c != 'c') 
err quit("WAIT CHILD: incorrect data"); 


15-2 ”让 父 进程 和 子 进程 同步 的 例 程 


如 图 15-8 中 所 示 ， 我 们 在 调用 fork 之 前 创建 了 两 个 管道 。 父 进程 在 调用 TELL CHILD 
时 ， 经 由 上 一 个 管道 写 一 个 字符 “p”， 子 进程 在 调用 TELL PARENT 时 ， 经 由 下 一 个 管道 写 
一 个 字符 “c”。 相 应 的 WAIT_XXX 函数 调用 read 读 一 个 字符 ， 没 有 读 到 字符 时 则 阻塞 《 休 
眠 等 待 )。 


pfdl[1] 


pfd2[0] 





Eli5-8 ”用 两 个 管道 实现 父 进程 和 子 进程 同步 
注意 , 每 一 个 管道 都 有 一 个 额外 的 读 取 进 程 , 这 没有 关系 。 也 就 是 说 , 除了 子 进 程 从 pfdl[0] 
读 取 ， 父 进程 也 有 上 一 个 管道 的 读 端 。 因 为 父 进程 并 没有 执行 对 该 管道 的 读 操作 ， 所 以 这 不 会 
影响 我 们 。 a" 
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15.3 函数 popen 和 pclose 


常见 的 操作 是 创建 一 个 连接 到 另 一 个 进程 的 管道 ， 然 后 读 其 输出 或 向 其 输入 端 发 送 数据 ， 为 
此 ， 标 准 VO 库 提 供 了 两 个 函数 popen 和 pclose。 这 两 个 函数 实现 的 操作 是 ;创建 一 个 管道 ， 
fork 一 个 子 进程 ， 关 闭 未 使 用 的 管道 端 ， 执 行 一 个 shell 运行 命令 ， 然 后 等 待命 令 终止 。 
#include <stdio.h> 
FILE *popen(const char *cmdstring, const char *type); 
返回 值 : 车 成 功 ， 返 回 文件 指针 ， 若 出 错 ， 返 回 NULL 


int pclose(FILE *fp); 





返回 值 : 车 成 功 ， 返 回 cmdstring 的 终止 状态 ; 若 出 错 ， 返 回 -1 


函数 popen 先 执行 fork, 然后 调用 exec 执行 emdstring, 并 且 返 回 一 个 标准 VO 文件 指针 。 
如 果 type 是 "r"， 则 文件 指针 连接 到 emdstring 的 标准 输出 〈 见 图 15-9). 
如 果 type 是 "w"， 则 文件 指针 连接 到 emdstring 的 标准 输入 ， 如 图 15-10 所 示 。 


父 进程 cmdstring ( 子 进程 ) 父 进程 cmdstring ( 子 进程 ) 
15-9 执行 fp = popen 15-10 执行 fp = popen 
(cmdstring，“"r") 的 结果 (emdstring，"w") 的 结果 


有 一 种 方法 可 以 帮助 我 们 记 住 popen 的 最 后 一 个 参数 及 其 作用 ， 这 就 是 与 fopen 进行 类 比 。 
如 果 type 是 "r"， 则 返回 的 文件 指针 是 可 读 的 ， 如 果 type 是 "w"， 则 是 可 写 的 。 

pclose BAKA LO 流 ， 等 待命 令 终止 ,然后 返回 shell 的 终止 状态 。( 我 们 曾 在 8.6 节 
中 描述 过 终止 状态 ，8.13 节 描 述 的 system 函数 也 返回 终止 状态 。) 如果 shell 不 能 被 执行 ， 则 
pclose 返回 的 终止 状态 与 shell 已 执行 exit (127) 一样 。 

cmdstring 由 Bourne shell 以 下 列 方式 执行 ; 


sh -c cmdstring 


这 表示 shell 将 扩展 cmdstring 中 的 任何 特殊 字符 。 例 如 ， 可 以 使 用 : 


fp = popen("Is *.c" , "r"); 
或 者 
fp = popen("cmd 2>61" , "r"); 


用 popen 重 写 图 15-6 中 的 程序 ， 其 结果 如 图 15-11 所 示 。 


#include "apue.h" 
#include <sys/wait.h> 


#define PAGER "S(PAGER:-more)" /* environment variable, or default */ 


int 
main(int argc, char *argv[]) 


char line [MAXLINE]; 
FILE *fpin, *fpout; 


if (argc != 2) 
err quit("usage: a.out «pathname»"); 
if ((fpin = fopen(argv[1], "r")) == NULL) 
err sys("can't open %s", argv[1]): 


if ((fpout = popen(PAGER, "w")) -- NULL) 
err sys("popen error"); 


/* copy argv[1] to pager */ 


while (fgets(line, MAXLINE, fpin) !- NULL) ( 


if (fputs(line, fpout) == EOF) 
err Sys("fputs error to pipe"); 
} 
if (ferror(fpin)) 
err Sys("fgets error"); 
if (pclose(fpout) -- -1) 
err sys("pclose error"); 


exit (0); 
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15-11 FA popen 向 分 页 程序 传送 文件 


使 用 popen 减少 了 需要 编写 的 代码 量 。 


shell 命令 $ (PAGER: -more} 的 意思 是 : WE shell 变量 PAGER 已 经 定义 ， 且 其 值 非 空 ， 则 使 


用 其 值 ， 否 则 使 用 字符 串 more. 


Ba SD: PAR popen 和 pclose 


15-12 中 的 程序 是 我 们 编写 的 popen 和 pclose. 


#include "apue.h" 
#include <errno.h> 
#include <fentl.h> 
#include <sys/wait.h> 


/* 

* Pointer to array allocated at run-time. 
a7 

static pid_t *childpid = NULL; 


/* 

* From our open max(), (Figure 2.17). 
*/ 

static int maxfd; 


FILE * 
popen (const char *cmdstring, const char *type) 
{ 

int i; 

int pfd[2]; 


ua" 
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pid t pid; 
FILE *fp; 


/* only allow "r" or "w" */ 





if ((type[0] != 'r' && type[0) != 'w') || type(1] != 0) { 


errno = EINVAL; 
return (NULL) ; 


if (childpid == NULL) { /* first time 


through */ 


/* allocate zeroed out array for child pids */ 


maxfd = open, max(); 


if ((childpid = calloc(maxfd, sizeof(pid t))) == NULL) 


return (NULL); 


if (pipe(pfd) < 0) 
return(NULL); /* errno set by pipe() */ 
if (pfd[0] >= maxfd || pfd[1] >= maxfd) I 
close (pfd[0]); 
close (pfd[1]); 
errno = EMFILE; 
return (NULL); 


if ((pid = fork({)) < 0) I 
return(NULL); /* errno set by fork() */ 
} else if (pid == 0) { 
if (*type == 'r') I 
close (pfd[0]):; 
if (pfd[1] != STDOUT FILENO) { 
dup2(pfd[1], STDOUT FILENO); 
close (pfd[1]); 
} 
) else { 
close (pfd[1]):; 
if (pfd[0] != STDIN FILENO) ( 
dup2(pfd[0], STDIN FILENO); 
close (pfd[0]); 


/* child */ 


/* close all descriptors in childpid[] */ 


for (i = 0; i < maxfd; i++) 
if (childpid[il > 0) 
close(i): 


execl("/bin/sh", "sh", "-c", cmdstring, 
„exit (127); 
} 


/* parent continues... */ 
if (*type == 'r') { 
close (pfd[1]); 
if ((fp = fdopen(pfd[0], type)) == NULL) 


(char *)0); 
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return (NULL) ; 
} else { 
close (pfd[0]); 
if ((fp = fdopen(pfd[1], type)) -- NULL) 
return (NULL); 


) 


childpid[fileno(fp)] = pid; /* remember child pid for this fd */ 
return (fp); 
} 


int 

pclose(FILE *fp) 

{ 
int fd, stat; 
pid t pid; 


if (childpid == NULL) { 

errno = EINVAL; 

return (-1); /* popen() has never been called */ 
} 


fd = fileno(fp); 
if (fd >= maxfd) { 
errno = EINVAL; 
returní-1): /* invalid file descriptor */ 
} 
if ((pid = childpid[fd]) == 0) { 
errno = EINVAL; 
return (-1); /* fp wasn't opened by popen() */ 
} 


childpid[fd] = 0; 
if (fclose(fp) == EOF) 
return (-1); 


while (waitpid(pid, &stat, 0) < 0) 
if (errno != EINTR) 
return (-1); /* error other than EINTR from waitpid() */ 


return (stat); /* return child's termination status */ 


Al 15-12 popen M&A pclose 函数 


虽然 popen 的 核心 部 分 与 本 章 中 前 面 用 过 的 代码 类 似 ， 但 是 增加 了 很 多 需要 考虑 的 细节 。 

首先 ， 每 次 调用 popen 时 ， 应 当 记 住所 创建 的 子 进程 的 进程 DD， 以 及 其 文件 描述 符 或 FILE 指 

£r. 我 们 选择 在 数组 childpid 中 保存 子 进程 ID, 并 用 文件 描述 符 作为 其 下 标 。 于 是 , SU FILE 

指针 作为 参数 调用 pclose 时 ， 调 用 标准 VO 函数 fileno 得 到 文件 描述 符 ， 然 后 取得 子 进程 D, 

并 用 其 作为 参数 调用 waitpid。 因 为 一 个 进程 可 能 调用 popen 多 次 ， 所 以 在 动态 分 配 childpid 

数组 时 《第 一 次 调用 popen 时 )， 其 数组 长 度 应 当 是 最 大 文件 描述 符 数 ， 于 是 该 数组 中 可 以 存放 

与 最 大 文件 描述 符 数 相同 的 子 进程 D 数 。 
注意 ， 图 2-17 中 的 open_max 函数 可 以 返回 打开 文件 的 最 大 个 数 的 近似 值 ， 如 果 这 个 值 与 系 
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统 不 相关 芍 话 。 注 意 不 要 使 用 那 种 其 值 大 于 (或 等 于 ) open max 函数 返回 值 的 管道 文件 描述 符 。 
对 于 popen， 如 果 open max 函数 返回 的 值 恰巧 非常 小 ， 那 我 们 会 关闭 管道 文件 描述 符 并 将 errno 
设置 为 EMFILE， 以 此 表明 这 里 的 很 多 文件 描述 符 是 打开 的 ， 最 后 返回 一 1。 对 于 pclose， 如 果 对 
应 于 文件 指针 参数 的 描述 符 比 所 期 望 的 大 ， 则 将 errno 设置 为 EINVAL， 并 返回 一 1。 

调用 pipe 和 fork, AEA popen 函数 中 的 每 个 进程 复制 合适 的 描述 符 ， 这 个 过 程 和 我 们 
在 本 章 前 面 所 做 的 相 类 似 。 

POSIX.1 要 求 popen 关闭 那些 以 前 调用 popen 打开 的 、 现 在 仍然 在 子 进程 中 打开 着 的 VO 
流 。 为 此 ， 在 子 进程 中 从 头 逐 个 检查 childpid 数组 的 各 个 元 素 ， 关 闭 仍 旧 打 开 着 的 描述 符 。 

若 pclose 的 调用 者 已 经 为 信号 SIGCHLD 设置 了 一 个 信和 号 处 理 程序 , 则 pclose 中 的 waitpid 
调用 将 返回 一 个 错误 EINTR。 因 为 允许 调用 者 捕 近 此 信号 (或 者 任何 其 他 可 能 中 断 waitpid 调用 的 
信号)， 所 以 当 waitpid 被 一 个 捕 提 到 的 信号 中 断 时 ， 我 们 只 是 再 次 调用 waitpid。 

注意 ， 如 果 应 用 程序 调用 waitpid， 并 且 获 得 了 popen 创建 的 子 进程 的 退出 状态 ， 那 么 我 
们 会 在 应 用 程序 调用 pclose 时 调用 waitpid, 如 果 发 现 子 进程 已 不 再 存在 ,将 返回 -1, 将 errno 
设置 为 EcHILD。 这 正 是 这 种 情况 下 POSIX.1 所 要 求 的 。 


| 如 果 一 个 信号 中 断 了 wait, pclose 的 一 些 早期 版 本 会 返回 错误 EINTR, pclose 的 一 些 早 期 版 
| 本 在 wait Mil, 会 阻塞 或 忽略 信号 SIGINT、SIGQUIT 和 SIGHUP。 这 是 POSIX 所 不 允许 的 。 "a 


注意 ，popen 决 不 应 由 设置 用 户 ID 或 设置 组 ID 程序 调用 。 当 它 执行 命令 时 ，popen SAT: 
execl("/bin/sh", "sh", "-c", command, NULL); 


它 在 从 调用 者 继承 的 环境 中 执行 shell， 并 由 shell 解释 执行 command。 一 个 恶意 用 户 可 以 操 
控 这 种 环境 , 使 得 shell 能 以 设置 ID 文件 模式 所 授予 的 提升 了 的 权限 以 及 非 预 期 的 方式 执行 命令 。 

popen 特别 适用 于 执行 简单 的 过 滤器 程序 ， 它 变换 运行 命令 的 输入 或 输出 。 当 命令 希望 构造 
它 自己 的 管道 时 ， 就 是 这 种 情形 。 


$a 实例 

考虑 一 个 应 用 程序 ， 它 向 标准 输出 写 一 个 提示 ， 然 后 从 标准 输入 读 1 行 。 使 用 popen， 可 以 
在 应 用 程序 和 输入 之 间 揪 入 一 个 程序 以 便 对 输入 父 进程 imme 
进行 变换 处 理 。 图 15-13 显示 了 这 种 情况 下 的 进程 
安排 。 

对 输入 进行 的 变换 可 能 是 路 径 名 扩充 , 或 者 是 
提供 一 种 历史 机 制 ( 记 住 以 前 输入 的 命令 )。 

15-14 是 一 个 简单 的 用 于 演示 这 个 操作 的 过 
滤 程 序 。 它 将 标准 输入 复制 到 标准 输出 ,在 复制 时 
将 大 写字 符 变换 为 小 写字 符 。 在 写 完 换行 符 之 后 ， 
要 仔细 冲洗 (用 fflush) 标准 输出 ， 这 样 做 的 理由 将 在 下 一 节 介绍 协同 进程 时 讨论 。 


#include "apue.h" 
#include <ctype.h> 





15-13 用 popen 对 输入 进行 变换 处 理 





int 
main(void) 


{ 
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int Cc; 


while ((c = getchar()) != EOF) { 
if (isupper(c)) 
c = tolower(c); 


if (putchar(c) == EOF) 
err sys("output error"); 
if (c == '\n') 


fflush(stdout); 
} 
exit(0); 


15-14 ”将 大 写字 符 变换 成 小 写字 符 的 过 滤 程 序 
将 这 个 过 滤 程 序 编译 成 可 执行 文件 myuclc， 然 后 图 15-15 的 程序 会 用 popen WAT. 


#include "apue.h" 
#include <sys/wait.h> 





int 
main (void) 


{ 


char line [MAXLINE]; 
FILE *fpin; 
if ((fpin = popen("myuclc", "r")) == NULL) 
err sys("popen error"); 
for [ Tox 


fputs("prompt» ", stdout); 
fflush (stdout); 


if (fgets(line, MAXLINE, fpin) == NULL) /* read from pipe */ 
break; 
if {fputs (line, stdout) == EOF) 


err sys("fputs error to pipe"); 
} 
if (pclose(fpin) == -1) 
err sys("pclose error"); 
putchar('\n'); 
exit(0); 


图 15-15 ”调用 大 写 / 小 写 过 滤 程 序 读 取 命令 


因为 标准 输出 通常 是 行 缓冲 的 ， 而 提示 并 不 包含 换行 符 ， 所 以 在 写 了 提示 之 后 ， 需 要 调用 
fflush. a 


15.4 ”协同 进程 


UNIX 系统 过 滤 程 序 从 标准 输入 读 取 数据 ， 向 标准 输出 写 数 据 。 几 个 过 滤 程 序 通 常 在 shell 管 
道中 线性 连接 。 当 一 个 过 滤 程 序 既 产生 某 个 过 滤 程 序 的 输入 ， 叉 读 取 该 过 滤 程 序 的 输出 时 ， 它 就 
变 成 了 协同 进程 《coprocess)。 

Korn shell 提供 了 协同 进程 [Bolsky and Korn 1995]. Bourne shell. Bourne-again shell 和 C shell 
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并 没有 提供 将 进程 连接 成 协同 进程 的 方法 。 协同 进程 通常 在 shell 的 后 台 运 行 , 其 标准 输入 和 标准 
输出 通过 管道 连接 到 另 一 个 程序 。 虽 然 初始 化 一 个 协同 进程 ， 并 将 其 输入 和 输出 连接 到 另 一 个 进 
程 的 shell 语法 是 十 分 奇特 的 (详细 情况 见 Bolsky 和 Kom[19951 中 的 第 62 一 63 页 )， 但 是 协同 进 


程 的 工作 方式 在 C 程序 中 也 是 非常 有 用 的 。 


popen 只 提供 连接 到 另 一 个 进程 的 标准 输入 或 标准 输出 的 一 个 单 向 管道 ， 而 协同 进程 则 有 连 
接 到 另 一 个 进程 的 两 个 单 向 管道 : 一 个 接 到 其 标准 输入 ， 另 一 个 则 来 自 其 标准 输出 。 我 们 想 将 数 
据 写 到 其 标准 输入 ， 经 其 处 理 后 ， 再 从 其 标准 输出 读 取 数据 。 


2 实例 


一 个 是 协同 进程 的 标准 输出 。 图 15-16 显示 了 这 
种 安排 。 
图 15-17 中 的 程序 是 一 个 简单 的 协同 进程 ， 
它 从 其 标准 输入 读 取 两 个 数 ， 计 算 它们 的 和 ， 然 
后 将 和 写 至 其 标准 输出 。( 协 同 进程 通常 会 做 较 
此 更 有 意义 的 工作 。 设 计 本 实例 的 目的 是 帮助 了 
解 将 进程 连接 起 来 所 需 的 各 种 管道 设施 。》 


finclude "apue.h" 


int 

main(void) 

{ 
int n, intl, int2; 
char line[MAXLINE]; 


让 我 们 通过 一 个 实例 来 观察 协同 进程 。 进 程 创建 两 个 管道 一 个 是 协同 进程 的 标准 输入 ， 另 


父 进 程 子 进程 ( 协同 进程 ) 
£d1[1] 管道 1 


Beo me 


管道 2 


图 15-16 通过 写 协同 进程 的 标准 输入 和 
读 取 它 的 标准 输 册 来 驱动 协同 进程 


while ((n = read(STDIN FILENO, line, MAXLINE)) > 0) ( 


line[n] = 0; /* null terminate */ 
if (sscanf {line, "%dtd", &intl, &int2) 
sprintf(line, "%d\n", intl + int2); 


n = strlen(line); 


== 2) { 


if (write (STDOUT_FILENO, line, n) != n) 
err_sys("write error"); 
} else ( 
if (write (STDOUT_FILENO, "invalid args\n", 13) != 13) 
err_sys("write error"); 
} 
} 
exit (0); 


图 15-17 ”将 两 个 数 相 加 的 简单 过 滤 程 序 


对 此 程序 进行 编译 ， 将 其 可 执行 目标 代码 存 入 名 为 add2 的 文件 。 
图 15-18 中 的 程序 从 其 标准 输入 读 取 两 个 数 之 后 调用 add2 协同 进程 ， 并 将 协同 进程 送 来 的 


值 写 到 其 标准 输出 。 


#include "apue.h" 


static void sig pipelint); /* our signal handler */ 


int 


main (void) 


{ 


int n, fdl[2], fd2[2]: 

pid t pid; 

char line [MAXLINE] ; 

if (signal(SIGPIPE, sig pipe) == SIG ERR) 


err sys("signal error"); 


if (pipe(fdl) < 0 || pipe(fd2) < 0) 
err sys("pipe error"); 


if ((pid = fork) < 0) { 
err sys("fork error"); 

} else if (pid > 0) { /* parent */ 
close (fd1[0)); 
close (fd2[1]); 


while (fgets(line, MAXLINE, stdin) != NULL) { 

n = strlen(line); 

if (write(fd1[1], line, n) != n) 
err Sys("write error to pipe"); 

if ((n = read(fd2[0], line, MAXLINE)) < O0) 
err sys("read error from pipe"); 

if (n == 0) ( 
err msg("child closed pipe"); 
break; 

} 

line[n] = 0; /* null terminate */ 

if (fputs(line, stdout) == EOF) 
err_sys("fputs error"); 


if (ferror(stdin) ) 
err sys("fgets error on stdin"); 

exit (0); 

} else { /* child */ 

close(fd1[1]); 

close(fd2[0]); 

if (fd1[0] t= STDIN FILENO) { 
if (dup2(fd1[0], STDIN FILENO) != STDIN FILENO) 

err sys("dup2 error to stdin"); 

close(fd1[0]); 


if (£d2[1] != STDOUT FILENO) I 
if (dup2(fd2[1], STDOUT FILENO) != STDOUT FILENO) 
err sys("dup2 error to stdout"); 
close(fd2[1]); 
} 
if (execl("./add2", "add2", (char *)0) < 0) 
err sys("execl error"); 
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} . 
exit(0): 
} 


static void 

sig_pipe(int signo) 

{ 
printf ("SIGPIPE caught\n"}; 
exit (i); 


15-18 ”驱动 add2 过 滤 程 序 的 程序 
这 个 程序 创建 了 两 个 管道 ， 父 进程 、 子 进程 各 自 关 闭 它们 不 需 使 用 的 管道 端 。 必 须 使 用 两 个 
管道 ， 一 个 用 作协 同 进程 的 标准 输入 ， 男 一 个 则 用 作 它 的 标准 输出 。 然 后 ， 子 进程 调用 dup2 使 
管道 描述 符 移 至 其 标准 输入 和 标准 输出 ， 最 后 调用 了 execl. 
车 编译 和 运行 图 15-18 中 的 程序 ， 它 会 按 预期 工作 。 此 外 ， 若 图 15-18 中 的 程序 在 等 待 输入 
的 时 候 杀 死 了 add2 协同 进程 ， 然 后 又 输入 两 个 数 ， RABIN ELH RR BERT SOLER 
会 调用 信号 处 理 程序 (见习 题 15.4)。 m 


*u 实例 


在 协同 进程 add2 CUALES 15-17) 中 ,我 们 故意 使 用 了 底层 IO (UNIX 系统 调用 ): read 和 write。 
如 果 使 用 标准 VO 来 改写 该 协同 进程 ， 会 怎么 样 呢 ? 图 15-19 所 示 的 程序 就 是 改写 后 的 版 本 。 


#include "apue.h" 


int 
main (void) 
{ 


int intl, int2; 
char line[MAXLINE]; 
while (fgets(line, MAXLINE, stdin) != NULL) { 
if (sscanf(line, "%d%d", &intl, &int2) == 2) { 
if (printf ("Sd\n", intl + int2) == EOF) 
err_sys("printf error"); 
} else { 


if (printf ("invalid args\n") == EOF) 
err_sys("printf error"); 
} 
} 
exit (0); 


图 15-19 将 两 个 数 相 加 的 过 滤 程 序 ， 使 用 标准 VO 
若 图 15-18 中 的 程序 调用 这 个 新 的 协同 进程 ， 则 它 不 再 工作 。 问 题 出 在 默认 的 标准 VO 缓冲 机 制 
上 。 当 调用 图 15-19 中 的 程序 时 ， 对 标准 输入 的 第 一 个 fgets 引起 标准 IO 库 分 配 一 个 缓冲 区 ， 并 选 
择 缓冲 的 类 型 。 因 为 标准 输入 是 一 个 管道 ， 所 以 标准 IO 库 默 认 是 全 缓冲 的 。 标 准 输出 也 是 如 此 。 当 
add2 从 其 标准 输入 读 取 而 发 生 阻塞 时 ， 图 15-18 中 的 程序 从 管道 读 时 也 发 生 阻 塞 ， 于 是 产生 了 和 死 锁 。 
这 里 ， 可 以 对 将 要 运行 的 这 一 协同 进程 加 以 控制 。 我 们 可 以 修改 图 15-19 中 的 程序 ， 在 
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while 循环 之 前 加 上 下 面 4 行 : 


if (setvbuf(stdin, NULL,  IOLBF, 0) !- 0) 
err sys("setvbuf error"); 

if (setvbuf(stdout, NULL,  IOLBF, 0)!- 0) 
err sys("setvbuf error"); 


这 些 代码 行使 得 当 有 一 行 可 用 时 ，fgets 就 返回 ; 当 输 出 一 个 换行 符 时 ，printf 立即 执行 
fflush 操作 。 对 setvbuf 进行 的 这 些 显 式 调用 使 得 图 15-19 中 的 程序 能 正常 工作 了 。 

如 果 不 能 修改 管道 输出 的 目标 程序 ， 则 需 使 用 其 他 技术 。 例 如 ， 如 果 在 程序 中 使 用 awk(1) 
作为 协同 进程 (代替 add2 程序 )， 则 下 列 命令 行 不 能 工作 : 


#! /bin/awk/ -f 
( print $1 * $2 ] 


不 能 工作 的 原因 还 是 标准 IO 的 缓冲 机 制 问题 。 但 是 在 这 种 情况 下 , 无 法 改变 awk 的 工作 方式 ( 除 
非 有 awk 的 源 代码 )。 我 们 不 能 修改 awk 的 可 执行 代码 ， 于 是 也 就 不 能 更 改 处 理 其 标准 IO 缓冲 
的 方式 。 

对 这 种 问题 的 一 般 解决 方法 是 使 被 调用 在 本 例 中 是 awk) 的 协同 进程 认为 它 的 标准 输入 和 
输出 都 被 连接 到 了 一 个 终端 。 这 使 得 协同 进程 中 的 标准 VO 例 程 对 这 两 个 VO 流 进行 行 缓冲 ， 
类 似 于 前 面 所 做 的 显 式 调用 setvbuf。 第 19 章 将 用 伪 终 端 实现 这 种 方法 。 a" 
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FIFO 有 时 被 称 为 命名 管道 。 未 命名 的 管道 只 能 在 两 个 相关 的 进程 之 间 使 用 , 而 且 这 两 个 相关 
的 进程 还 要 有 一 个 共同 的 创建 了 它们 的 祖先 进程 。 但 是 ， 通 过 FIFO， 不 相关 的 进程 也 能 交换 数据 。 

第 14 章 中 已 经 提 及 FIFO 是 一 种 文件 类 型 。 通 过 stat 结构 ( 见 4.2 节 ) 的 st. mode 成 员 的 
编码 可 以 知道 文件 是 否 是 FFO 类 型 。 可 以 用 S_ISFIFO 宏 对 此 进行 测试 。 

创建 FIFO 类 似 于 创建 文件 。 确 实 ，FIFO 的 路 径 名 存在 于 文件 系统 中 。 


#include <sys/stat.h> 


int mkfifo(const char *path, mode_t mode); 


int mkfifoat(int fd, const char *path, mode t mode); 
两 个 函数 的 返回 值 : ARH, EO: Awe, Ae- 





mkfifo 函数 中 mode 参数 的 规格 说 明 与 open 函数 中 mode 的 相同 ( 见 3.3 节 )。 新 FIFO 的 
用 户 和 组 的 所 有 权 规 则 与 4.6 节 所 述 的 相同 。 

mkfifoat 函数 和 mkfifo 函数 相似 ， 但 是 mkfifoat 函数 可 以 被 用 来 在 d 文件 描述 符 表 
示 的 目录 相关 的 位 置 创建 一 个 FIFO。 像 其 他 *at 函数 一 样 ， 这 里 有 3 种 情形 : 

(1) WẸ path 参数 指定 的 是 绝对 路 径 名 ， 则 应 参数 会 被 忽略 掉 ， 并 且 mkfifoat 函数 的 行 
为 和 mkfifo RU. 

(2) WẸ path 参数 指定 的 是 相对 路 径 名 ， 则 fa 参数 是 一 个 打开 目录 的 有 效 文件 描述 符 ， 中 8 
径 名 和 目录 有 关 。 

(3) WẸ path 参数 指定 的 是 相对 路 径 名 ， 并 且 应 参数 有 一 个 特殊 值 AT_FDCWD， 则 路 径 名 
以 当前 目录 开始 ，mkfifoat 和 mkfifo 类 似 。 


446 第 15 章 进程 间 通信 


当 我 们 用 mkfifo 或 者 mkfifoat 创建 FIFO 时 ， 要 用 open 来 打开 它 。 确 实 ， 正 常 的 文件 
LO 函数 (如 close. read. write Ml unlink) 都 需要 FIFO。 


应 用 程序 可 以 用 mknod 和 mknodat 函数 创建 FIFO。 因 为 POSIX.1 原先 并 没有 包括 mknod 
函数 ， 所 以 mkfifo 是 专门 为 POSIX.1 设计 的 。mknod 和 mknodat 通 数 现在 已 包括 在 POSIX.1 
&j XSI 扩展 中 。 

POSIX.1 也 包括 了 对 mkfifo(1) 命 令 的 支持 。 本 书 讨论 的 4 种 平台 都 提供 此 命令 。 因 此 ， 可 
以 用 一 条 shell 命令 创建 一 个 FIFO， 然 后 用 一 般 的 shell VO 重 定向 对 其 进行 访问 。 


当 open 一 个 FIFO 时 ， 非 阻塞 标志 (O_NONBLOCK) 会 产生 下 列 影响 。 
e 在 一 般 情 况 下 〈 没 有 指定 O_NONBLOCK)， 只 读 open 要 阻塞 到 某 个 其 他 进程 为 写 而 打开 
这 个 FIFO 为 止 。 类 似 地 ， 只 写 open 要 阻塞 到 某 个 其 他 进程 为 读 而 打开 它 为 止 。 
e 如果 指 定 了 0_NONBLOCK， 则 只 读 open 立即 返回 。 但 是 ， 如 果 没 有 进程 为 读 而 打开 一 
AFIFO, ARY open 将 返回 -1， 并 将 errno 设置 成 ENXIO。 
类 似 于 管道 ， 若 write 一 个 尚 无 进程 为 读 而 打开 的 FIFO， 则 产生 信号 sIGPIPE. BET 
FIFO 的 最 后 一 个 写 进程 关闭 了 该 FIFO， 则 将 为 该 FIFO 的 读 进程 产生 一 个 文件 结束 标志 。 

[553] 一 个 给 定 的 FIFO 有 多 个 写 进 程 是 常见 的 。 这 就 意味 着 ， 如 果 不 希望 多 个 进程 所 写 的 数据 交 
叉 ， 则 必须 考虑 原子 写 操作 。 和 管道 一 样 ， 常 量 PIPE_BUF 说 明了 可 被 原子 地 写 到 FIFO 的 最 大 
数据 量 。 

FIFO 有 以 下 两 种 用 途 。 

C1) shell 命令 使 用 FIFO 将 数据 从 一 条 管道 传送 到 另 一 条 时 ， 无 需 创建 中 间 临 时 文件 。 

(2) 客户 进程 -服务 器 进程 应 用 程序 中 ，FIFO 用 作 汇 聚 点 ， 在 客户 进程 和 服务 器 进程 二 者 之 
间 传 递 数据 。 

我 们 各 用 一 个 实例 来 说 明 这 两 种 用 途 。 


二 实例: 用 FIFO 复制 输出 流 
FIFO 可 用 于 复制 一 系列 sell 命令 中 的 输出 流 。 这 就 防止 了 将 数据 写 向 中 间 磁 盘 文件 (类似 于 
使 用 管道 来 避免 中 间 磁 盘 文 件 )。 但 是 不 同 的 是 ， 
管道 只 能 用 于 两 个 进程 之 间 的 线性 连接 ,而 FIFO Dee 
是 有 名 字 的 ， 因 此 它 可 用 于 非 线性 连接 。 输入 
考虑 这 样 一 个 过 程 ， 它 需要 对 一 个 经 过 过 滤 的 。 文件 
输入 流 进行 两 次 处 理 。 图 15-20 显示 了 这 种 安排 。 ee | 
使 用 FIFO 和 UNIX 程序 tee(1) 就 可 以 实现 
这 样 的 过 程 而 无 需 使 用 临时 文件 。(tee 程序 将 图 15-20 ”对 一 个 经 过 过 滤 的 输入 
其 标准 输入 同时 复制 到 其 标准 输出 以 及 其 命令 流 进行 两 次 处 理 的 过 程 
行 中 命名 的 文件 中 。) 


mkfifo fifol 
prog3 « fifol & 
progl < infile | tee fifol | prog2 


创建 FIFO， 然 后 在 后 台 启 动 prog3， 从 FIFO 读数 据 。 然 后 启动 progl1， 用 tee 将 其 输出 
发 送 到 FIFO 和 prog2。 图 15-21 显示 了 进程 安排 。 "i 


| 
| 
| 
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15-21 使 用 FIFO 和 tee 将 一 个 流 发 送 到 两 个 不 同 的 进程 


实例 : 使 用 FIFO 进行 客户 进程 -服务 器 进程 通信 





FIFO 的 另 一 个 用 途 是 在 客户 进程 和 服务 器 进程 之 间 传 送 数据 。 如 果 有 一 个 服务 器 进程 ， 它 与 
很 多 客户 进程 有 关 ， 每 个 客户 进程 都 可 将 其 请 求 写 到 一 个 该 服务 器 进程 创建 的 众所周知 的 FIFO 中 
(“众所周知 ”的 意思 是 : 所 有 需 与 服务 器 进程 联系 的 客户 进程 都 知道 该 FIFO 的 路 径 名 )。 图 15-22 


显示 了 这 种 安排 。 

因为 该 FIFO 有 多 个 写 进程 ， 所 以 客户 进程 发 
送 给 服务 器 进程 的 请 求 的 长 度 要 小 于 PIPE_BUF 字 
节 。 这 样 就 能 避免 客户 进程 的 多 次 写 之 间 的 交叉 。 

在 这 种 类 型 的 客户 进程 -服务 器 进程 通信 中 
使 用 FIFO 的 问题 是 : 服务 器 进程 如 何 将 回答 送 回 
各 个 客户 进程 。 不 能 使 用 单个 FIFO， 因 为 客户 进 
程 不 可 能 知道 何 时 去 读 它们 的 响应 以 及 何 时 响应 
其 他 客户 进程 。 一 种 解决 方法 是 ， 每 个 客户 进程 
都 在 其 请 求 中 包含 它 的 进程 ID。 然 后 服务 器 进程 
为 每 个 客户 进程 创建 一 个 FIFO,， 所 使 用 的 路 径 名 
是 以 客户 进程 的 进程 ID 为 基础 的 。 例 如 ， 服 务 器 
进程 可 以 用 名 字 /tmp/servl .XXXXX 创建 FIFO, 





15-222 ”客户 进程 用 FIFO 向 
服务 器 进程 发 送 请 求 


其 中 xxxxx 被 替换 成 客户 进程 的 进程 DD。 图 15-23 显示 了 这 种 安排 。 





15-23 ”用 FIFO 进行 客户 进程 -服务 器 进程 通信 
虽然 这 种 安排 可 以 工作 ， 但 服务 器 进程 不 能 判 疡 一 个 客户 进程 是 否 骨 溃 终 止 ， 这 就 使 得 客户 
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进程 专用 FIFO 会 遗留 在 文件 系统 中 。 另 外 ， 服 务 器 进程 还 必须 得 捕捉 SIGPIPE 信和 号， 因为 客户 
进程 在 发 送 一 个 请 求 后 有 可 能 没有 读 取 响应 就 终止 了 ， 于 是 留 下 一 个 只 有 写 进程 《服务器 进程 ) 
而 无 读 进 程 的 客户 进程 专用 FIFO。 

按照 图 15-23 中 的 安排 ， 如 果 服 务 器 进程 以 只 读 方 式 打开 众所周知 的 FIFO (因为 它 只 需 读 该 
FIFO)， 则 每 当 客 户 进 程 个 数 从 1 变 成 0 时 ， 服 务 器 进程 就 将 在 FIFO 中 读 到 Creaa) 一 个 文件 
结束 标志 。 为 使 服务 器 进程 免 于 处 理 这 种 情况 ,一 种 常用 的 技巧 是 使 服务 器 进程 以 读 - 写 方式 打开 
该 众所周知 的 FIFO (见习 题 15.10)。 "i 


15.6 XSIIPC 


有 3 种 称 作 XSI IPC 的 IPC: 消息 队列 、 信 号 量 以 及 共享 存储 器 。 它 们 之 间 有 很 多 相似 之 处 。 
本 节 先 介绍 它们 相 类 似 的 特征 ， 后 面 几 节 将 说 明 这 些 IPC 各 自 的 特殊 功能 。 


| XSI IPC 函数 是 紧密 地 基于 System V 的 IPC BAH, i 3 种 类 型 的 XSIIPC 源 自 于 1970 年 的 
一 种 称 为 “Columbus UNIX” $) AT&T 内 部 版 本 。 后 来 它们 被 添加 到 System V 上 。 由 于 XSI IPC 
| 不 使 用 文件 系统 命名 空间 ， 而 是 构造 了 它们 自己 的 命名 空间 ， 为 此 常常 受到 批评 。 


15.6.1 ”标识 符 和 键 


每 个 内 核 中 的 IPC 结构 (消息 队列 、 信 号 量 或 共享 存储 段 ， 都 用 一 个 非 负 整数 的 标识 符 
(identifier) 加 以 引用 。 例 如 ， 要 向 一 个 消息 队列 发 送 消 息 或 者 从 一 个 消息 队列 取消 息 ， 只 需要 知道 
其 队列 标识 符 。 与 文件 描述 符 不 同 ，IPC 标识 符 不 是 小 的 整数 。 当 一 个 IPC 结构 被 创建 ， 然 后 又 被 
删除 时 ， 与 这 种 结构 相关 的 标识 符 连续 加 1， 直 至 达到 一 个 整 型 数 的 最 大 正 值 ， 然 后 又 回转 到 0。 

标识 符 是 IPC 对 象 的 内 部 名 。 为 使 多 个 合作 进程 能 够 在 同一 IPC 对 象 上 汇聚 ， 需 要 提供 一 个 
外 部 命名 方案 。 为 此 ， 每 个 IPC 对 象 都 与 一 个 键 (key) 相关 联 ， 将 这 个 键 作 为 该 对 象 的 外 部 名 。 

无 论 何 时 创建 IPC 结构 (通过 调用 msgget、semget 或 shmget 创建 )， 都 应 指定 一 个 键 。 
这 个 键 的 数据 类 型 是 基本 系统 数据 类 型 key +， 通常 在 头 文件 <sys/types .h> 中 被 定义 为 长 整 
型 。 这 个 键 由 内 核 变换 成 标识 符 。 

有 多 种 方法 使 客户 进程 和 服务 器 进程 在 同一 IPC 结构 上 汇聚 。 

(1) 服务 器 进程 可 以 指定 键 IPC PRIVATE 创建 一 个 新 IPC 结构 ， 将 返回 的 标识 符 存放 在 某 
处 《如 一 个 文件 ) 以 便 客 户 进程 取 用 。 键 IPC_PRIVRTE 保证 服务 器 进程 创建 一 个 新 IPC 结构 。 
这 种 技术 的 缺点 是 : 文件 系统 操作 需要 服务 器 进程 将 整 型 标识 符 写 到 文件 中 ， 此 后 客户 进程 又 要 
读 这 个 文件 取得 此 标识 符 。 

IPC PRIVATE 键 也 可 用 于 父 进程 子 关 系 。 父 进程 指定 IPC PRIVATE 创建 一 个 新 IPC 结构 ， 
所 返回 的 标识 符 可 供 fork 后 的 子 进程 使 用 。 接 着 ， 子 进程 又 可 将 此 标识 符 作 为 exec 函数 的 一 


”个 参数 传 给 一 个 新 程序 。 


(2) 可 以 在 一 个 公用 头 文件 中 定义 一 个 客户 进程 和 服务 器 进程 都 认可 的 键 。 然 后 服务 器 进程 
指定 此 键 创建 一 个 新 的 IPC 结构 。 这 种 方法 的 问题 是 该 键 可 能 已 与 一 个 IPC 结构 相 结合 ， 在 此 情 
况 下 ，get 函数 (msgget、semget 或 shmget) 出 错 返 回 。 服 务 器 进程 必须 处 理 这 一 错误 ， 删 
除 已 存在 的 IPC 结构 ， 然 后 试 着 再 创建 它 。 

(3) 客户 进程 和 服务 器 进程 认同 一 个 路 径 名 和 项 目 ID CORE D Æ 0~255 之 间 的 字符 值 )， 
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接着 ,调用 函数 ftok 将 这 两 个 值 变换 为 一 个 键 。 然 后 在 方法 2) 中 使 用 此 键 。ftok 提供 的 唯 
一 服务 就 是 由 一 个 路 径 名 和 项 目 ID 产生 一 个 键 。 


finclude <sys/ipc.h> 


key t ftok(const char *path, int id); 





path 参数 必须 引用 一 个 现 有 的 文件 。 当 产生 键 时 ， 只 使 用 id 参数 的 低 8 位 。 

ftok 创建 的 键 通 常 是 用 下 列 方式 构成 的 ， 按 给 定 的 路 径 名 取得 其 stat 结构 〈( 见 4.2 节 ) 中 
的 部 分 st_dev 和 st_ino 字段 ， 然 后 再 将 它们 与 项 目 ID 组 合 起 来 。 如 果 两 个 路 径 名 引用 的 是 两 
个 不 同 的 文件 ， 那 么 ftok 通常 会 为 这 两 个 路 径 名 返回 不 同 的 键 。 但 是 ， 因 为 i 节点 编号 和 键 通 常 
都 存放 在 长 整 型 中 ， 所 以 创建 键 时 可 能 会 丢失 信息 。 这 意味 着 ， 对 于 不 同文 件 的 两 个 路 径 名 ， 如 果 
使 用 同一 项 目 ID， 那 么 可 能 产生 相同 的 键 。 

3 个 get 函数 (msgget、semget 和 shmget) 都 有 两 个 类 似 的 参数 : 一 个 key 和 一 个 整 型 
flag。 在 创建 新 的 IPC 结构 (通常 由 服务 器 进程 创建 》 时 ， 如 果 key 是 IPC PRIVATE 或 者 和 当前 
某 种 类 型 的 IPC 结构 无 关 ， 则 需要 指明 flag 的 IPC CREAT 标志 位 。 为 了 引用 一 个 现 有 队列 Gf 
常 由 客户 进程 创建 )，key 必须 等 于 队列 创建 时 指明 的 key 的 值 ， 并 且 IPC CREAT 必须 不 被 指明 。 

注意 ， 决 不 能 指定 IPC PRIVATE 作为 键 来 引用 一 个 现 有 队列 ， 因 为 这 个 特殊 的 键 值 总 是 
用 于 创建 一 个 新 队列 。 为 了 引用 一 个 用 rPC PRIVATE 键 创建 的 现 有 队列 ， 一 定 要 知道 这 个 相 
关 的 标识 符 ， 然 后 在 其 他 IPC 调用 中 (如 msgsnd. msgrev) 使 用 该 标识 符 ， 这 样 可 以 绕 过 
get 函数 。 

如 果 希 望 创建 一 个 新 的 IPC 结构 ， 而 且 要 确保 没有 引用 具有 同一 标识 符 的 一 个 现 有 IPC 结构 ， 
那么 必须 在 flag 中 同时 指定 IPC CREAT 和 IPC EXCL 位 。 这 样 做 了 以 后 ， 如 果 IPC 结构 已 经 存 
在 就 会 造成 出 错 ， 返 回 EEXIST (这 与 指定 了 C_CRERAT 和 0_EXCL 标志 的 open 相 类 似 )。 


15.6.2 ”权限 结构 


XSI IPC 为 每 一 个 IPC 结构 关联 了 一 个 ipe perm 结构 。 该 结构 规定 了 权限 和 所 有 者 ， 它 至 
少 包 括 下 列 成 员 : 
struct ipc perm { 
uid t uid; /* owner's effective user id */ 
gidt gid; /* owner's effective group id */ 
uid t cuid; /* creator's effective user id */ 
gid t cgid; /* creator's effective group id */ 
mode t mode; /* access modes */ 


he 
每 个 实现 会 包括 另外 一 些 成 员 。 如 欲 了 解 你 所 用 系统 中 它 的 完整 定义 ， 请 参见 <sys/ipc.h>。 
在 创建 IPC 结构 时 ， 对 所 有 字段 都 赋 初 值 。 以 后 ， 可 以 调用 msgctl. semcti 或 shmctl 
修改 uid、gid 和 mode 字段 。 为 了 修改 这 些 值 ， 调 用 进程 必须 是 IPC 结构 的 创建 者 或 超级 用 户 。 
修改 这 些 字段 类 似 于 对 文件 调用 chown 和 chmod. 
mode 字段 的 值 类 似 于 图 4-6 中 所 示 的 值 ， 但 是 对 于 任何 IPC 结构 都 不 存在 执行 权限 。 另 外 ， 消 
息 队 列 和 共享 存储 使 用 术语 “ 读 ” 和 “和 写 ”， 而 信号 量 则 用 术语 “ 读 ” 和 “更 改 ” (alter)。 图 15-24 
显示 了 每 种 IPC 的 6 种 权限 。 
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其 他 读 0004 
其 他 写 CE) 0002 
15-24 XSI IPC 权限 


某 些 实现 定义 了 表示 每 种 权限 的 符号 常量 ， 但 是 这 些 常量 并 不 包括 在 Single UNIX Specification 中 。 
15.6.3 ”结构 限制 


所 有 3 种 形式 的 XSI IPC 都 有 内 置 限制 。 大 多 数 限制 可 以 通过 重新 配置 内 核 来 改变 。 在 对 这 
3 种 形式 的 IPC 中 的 每 一 种 进行 描述 时 ， 我 们 都 会 指出 它 的 限制 。 


在 报告 和 修改 限制 方面 ， 每 种 平台 都 有 自己 的 方法 。FreeBSD 8.0、Linux 3.2.0 和 Mac OS X 
| 10.6.8 提供 了 sysctl 命令 来 观察 和 修改 内 核 配置 参数 。 在 Solaris 10 中 ， 可 以 用 prctl 命令 来 
改变 内 核 IPC 的 限制 。 

Æ Linux 中 ， 可 以 运行 ipcs -1 来 显示 IPC 相关 的 限制 。 在 FreeBSD 中 ， 等 效 的 命令 是 ipcs 
-To Æ Solaris 中 ， 可 以 通过 运行 sysdef -y 来 找到 可 调节 参数 。 


15.6.4. DLSURIA ER 


XSI IPC 的 一 个 基本 问题 是 : IPC 结构 是 在 系统 范围 内 起 作用 的 ， 没 有 引用 计数 。 例 如 ， 如 
果 进 程 创建 了 一 个 消息 队列 ， 并 且 在 该 队列 中 放 入 了 几 则 消息 ， 然 后 终止 ， 那 么 该 消息 队列 及 其 
内 容 不 会 被 删除 。 它 们 会 一 直 留 在 系统 中 直至 发 生 下 列 动 作为 止 ， 由 某 个 进程 调用 msgrcv 或 
msgctl 读 消息 或 删除 消息 队列 ; 或 某 个 进程 执行 ijpcrm(1) 命 令 删 除 消息 队列 ; 或 正在 自 举 的 系 
统 删除 消息 队列 。 将 此 与 管道 相 比 ， 当 最 后 一 个 引用 管道 的 进程 终止 时 ， 管 道 就 被 完全 地 删除 了 。 
对 于 FIFO 而 言 ， 在 最 后 一 个 引用 FIFO 的 进程 终止 时 ， 虽 然 FIFO 的 名 字 仍 保留 在 系统 中 ， 直 至 
被 显 式 地 删除 ， 但 是 留 在 FIFO 中 的 数据 已 被 删除 了 。 

XSI IPC 的 另 一 个 问题 是 ， 这些 IPC 结构 在 文件 系统 中 没有 名 字 。 我 们 不 能 用 第 3 章 和 第 4 章 中 
所 述 的 函数 来 访问 它们 或 修改 它们 的 属性 。 为 了 支持 这 些 IPC 对 象 ， 内 核 中 增加 了 十 几 个 全 新 的 系统 
调用 (msgget、semop、shmat 等 )。 我 们 不 能 用 1s 命令 查看 IPC 对 象 ， 不 能 用 rm 命令 删除 它们 ， 

也 不 能 用 chmod 命令 修改 它们 的 访问 权限 。 于 是 ， 又 增加 了 两 个 新 命令 iPcs(1) 和 ipcrm(l). 
因为 这 些 形式 的 IPC 不 使 用 文件 描述 符 ， 所 以 不 能 对 它们 使 用 多 路 转 接 IO 函数 (select 
和 pol1)。 这 使 得 它 很 难 一 次 使 用 一 个 以 上 这 样 的 IPC 结构 ， 或 者 在 文件 或 设备 VO 中 使 用 这 样 
的 IPC 结构 。 例 如 ， 如 果 没 有 某 种 形式 的 忙 等 循环 (busy-wait loop)， 就 不 能 使 一 个 服务 器 进程 
等 待 将 要 放 在 两 个 消息 队列 中 任意 一 个 中 的 消息 。 

Andrade、Carges 和 Kovach[1989] 对 使 用 System V IPC 构建 的 一 个 事务 处 理 系统 进行 了 综述 。 
他 们 认为 System V IPC 使 用 的 命名 空间 〈 标 识 符 ) 是 一 个 优点 ， 而 不 是 前 面 所 说 的 问题 ， 理 由 是 
使 用 标识 符 使 一 个 进程 只 要 使 用 单个 函数 调用 (msgsnd) 就 能 将 一 个 消息 发 送 到 一 个 队列 ， 而 
其 他 形式 的 IPC 则 通常 还 要 调用 open. write 和 close。 这 种 说 法 是 错误 的 。 为 了 避免 使 用 键 
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和 调用 msgget， 客 户 进程 总 要 以 某 种 方式 获得 服务 器 进程 队列 的 标识 符 。 分 派 给 特定 队列 的 标 
识 符 取 决 于 在 创建 该 队列 时 ， 有 多 少 消息 队列 已 经 存在 ， 也 取决 于 自 内 核 自 举 以 来 ， 内 核 中 将 分 
配给 新 队列 的 表 项 已 经 使 用 了 多 少 次 。 这 是 一 个 动态 值 ， 无 法 猜 到 或 事先 存放 在 一 个 头 文件 中 。 
正如 15.6.1 节 所 述 ， 至 少 服务 器 进程 应 将 分 配给 队列 的 标识 符 写 到 一 个 文件 中 以 便 客 户 进程 读 取 。 

这 些 作者 列举 的 消息 队列 的 其 他 优点 是 : 它们 是 可 靠 的 、 流 控制 的 以 及 面向 记录 的 ， 它们 可 
以 用 非 先 进 先 出 次 序 处 理 。 图 15-25 对 这 些 不 同形 式 IPC 的 某 些 特征 进行 了 比较 。 


TE 


消息 队列 | 
STREAMS 


UNIX 域 流 套 接 字 
UNIX 域 数 据 报 套 接 字 
FIFO (4E STREAMS) 





四 15-25 ”不 同形 式 IPC 之 间 的 特征 比较 

(我 们 将 在 第 16 章 中 描述 流 和 数据 报 套 接 字 ， 在 17.2 节 中 描述 UNIX 域 套 接 字 。) 图 15-25 
中 的 “无 连接 ” 指 的 是 无 需 先 调用 某 种 形式 的 打开 函数 就 能 发 送 消息 的 能 力 。 如 前 所 述 ， 因 为 需 
要 有 某 种 技术 来 获得 队列 标识 符 ， 所 以 我 们 并 不 认为 消息 队列 是 无 连接 的 。 因 为 所 有 这 些 形式 的 
IPC 被 限制 在 一 台 主 机 上 ， 所 以 它们 都 是 可 靠 的 。 当 消息 通过 网 络 传送 时 ， 就 要 考虑 丢失 消息 的 
可 能 性 。“ 流 控制 ”的 意思 是 ， 如 果 系 统 资源 (缓冲 区 ) 短缺 ， 或 者 如 果 接 收 进程 不 能 再 接收 更 
多 消息 ， 则 发 送 进 程 就 要 休眠 。 当 流 控制 条 件 消失 时 ， 发 送 进程 应 自动 唤醒 。 

图 15-25 中 没有 显示 的 一 个 特征 是 : IPC 设施 能 否 自 动 地 为 每 个 客户 进程 创建 一 个 到 服务 器 进 
程 的 唯一 连接 。 第 17 章 将 说 明 UNIX 流 套 接 字 可 以 提供 这 种 能 力 。 下 面 3 节 将 对 3 种 形式 的 XSI IPC 
进行 详细 的 描述 。 


15.7 消息 队列 


消息 队列 是 消息 的 链接 表 ， 存 储 在 内 核 中 ， 由 消息 队列 标识 符 标 识 。 在 本 节 中 ， 我 们 把 消息 
队列 简称 为 队列 ， 其 标识 符 简 称 为 队列 ID. 
Single UNIX Specification 的 消息 传送 选项 中 包括 一 种 替代 的 IPC 消息 队列 接口 ， 该 接口 来 源 
”于 POSIX 实时 扩展 。 本 书 不 讨论 这 个 接口 。 


msgget 用 于 创建 一 个 新 队列 或 打开 一 个 现 有 队列 。msgsnd 将 新 消息 添加 到 队列 尾 端 。 每 
个 消息 包含 一 个 正 的 长 整 型 类 型 的 字段 、 一 个 非 负 的 长 度 以 及 实际 数据 字 节 数 〈 对 应 于 长 度 )， 
所 有 这 些 都 在 将 消息 添加 到 队列 时 ， 传 送 给 msgsnd。msgrcv 用 于 从 队列 中 取消 息 。 我 们 并 不 
一 定 要 以 先进 先 出 次 序 取 消息 ， 也 可 以 按 消 息 的 类 型 字段 取消 息 。 

每 个 队列 都 有 一 个 msqid_as 结构 与 其 相关 联 : 


struct msqid ds { 


struct ipc perm msg perm; /* see Section 15.6.2 */ 
msgqnum t msg qnum; /* # of messages on queue */ 
msglen t msg qbytes; /* max # of bytes on queue */ 
pid t msg lspid; /* pid of last msgsnd() */ 


pid t msg lrpid; /* pid of last msgrcv() */ 
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time t msg stime; /* last-msgsnd() time */ 
time t msg rtime; /* last-msgrcv() time */ 
time t msg ctime; /* last-change time */ 


}e 
此 结构 定义 了 队列 的 当前 状态 。 结 构 中 所 示 的 各 成 员 是 由 Single UNIX Specification 定义 的 。 具 体 
实现 可 能 包括 标准 中 没有 定义 的 另 一 些 字段 。 

15-26 列 出 了 影响 消息 队列 的 系统 限制 。“ 导 出 的 ”表示 这 种 限制 来 源 于 其 他 限制 。 例 如 ， 
在 Linux 系统 中 ， 最 大 消息 数 是 根据 最 大 队列 数 和 队列 中 所 允许 的 最 大 数据 量 来 决定 的 。 其 中 最 
大 队列 数 还 要 根据 系统 上 安装 的 RAM 的 数量 来 决定 。 注 意 ， 队 列 的 最 大 字 节 数 限 制 进一步 限制 
了 队列 中 将 要 存储 的 消息 的 最 大 长 度 。 

调用 的 第 一 个 函数 通常 是 msgget， 其 功能 是 打 TER UE EB 


可 发 送 的 最 长 消息 的 字 节 数 。 

一 个 特定 队列 的 最 大 字 节 数 ( 亦 即 队 

列 中 所 有 消息 长 度 之 和 ) 

系统 中 最 大 消息 队列 数 
系统 中 最 大 消息 数 





图 15-26 影响 消息 队列 的 系统 限制 


#include <sys/msg.h> 


int msgget(key t key, int flag); 





返回 值 : 若 成 功 ， 返 回 消息 队列 ID; 若 出 错 ， 返 回 一 1 


15.6.1 节 说 明了 将 key 变换 成 一 个 标识 符 的 规则 ， 并 且 讨 论 了 是 创建 一 个 新 队列 还 是 引用 一 
个 现 有 队列 。 在 创建 新 队列 时 ， 要 初始 化 msqid-as 结构 的 下 列 成 员 。 

。 ipc-perm 结构 按 15.6.2 节 中 所 述 进行 初始 化 。 该 结构 中 的 mode 成 员 按 flag 中 的 相应 

权限 位 设置 。 这 些 权限 用 图 15-24 中 的 值 指定 。 

e msg qnum. msg lspid. msg lrpid. msg stime 和 msg rtime 都 设置 为 0。 

e msg ctime 设置 为 当前 时 间 。 

e msg qbytes 设置 为 系统 限制 值 。 

车 执行 成 功 ，msgget 返回 非 负 队列 DD。 此 后 ， 该 值 就 可 被 用 于 其 他 3 个 消息 队列 函数 。 

msgctl 函数 对 队列 执行 多 种 操作 。 它 和 另外 两 个 与 信号 量 及 共享 存储 有 关 的 函数 (semct1 
和 shmct1) 都 是 XSI PC 的 类 似 于 ioctl 的 函数 〈 亦 即 垃圾 桶 函数 )。 


#include <sys/msg.h> 


int msgctl(int msgid, int cmd, struct msqid ds *buf); 





cmd 参数 指定 对 msgid 指定 的 队列 要 执行 的 命令 。 

IPC STAT ” 取 此 队列 的 msqiq_ds 结构 ， 并 将 它 存放 在 buf 指向 的 结构 中 。 

IPC_SET 将 字段 msg perm.uid. msg perm.gid. msg_perm.mode 和 msg qbytes 
从 itr 指 向 的 结构 复制 到 与 这 个 队列 相关 的 msqid ds 结构 中 。 此 命令 只 能 由 下 列 
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两 种 进程 执行 : 一 种 是 其 有 效用 户 ID EF msg perm.cuid msg perm.uid, 
另 一 种 是 具有 超级 用 户 特 权 的 进程 。 只 有 超级 用 户 才 能 增加 msg_qbytes 的 值 。 
IPC RMID ”从 系统 中 删除 该 消息 队列 以 及 仍 在 该 队列 中 的 所 有 数据 。 这 种 删除 立即 生效 。 
仍 在 使 用 这 一 消息 队列 的 其 他 进程 在 它们 下 一 次 试图 对 此 队列 进行 操作 时 ， 将 
得 到 RIDRM 错误 。 此 命令 只 能 由 下 列 两 种 进程 执行 ， 一 种 是 其 有 效用 户 ID 等 
于 msg_perm.cuid 或 msg_perm.uid; 另 一 种 是 具有 超级 用 户 特 权 的 进程 。 
这 3 条 命令 (IPC STAT. IPC SET 和 IPC RMID) 也 可 用 于 信和 号 量 和 共享 存储 。 
调用 msgsnd 将 数据 放 到 消息 队列 中 。 





正如 前 面 提 及 的 ， 每 个 消息 都 由 3 部 分 组 成 : 一 个 正 的 长 整 型 类 型 的 字段 、 errr 
(nbytes) 以 及 实际 数据 字 节 数 〈 对 应 于 长 度 )。 消 息 总 是 放 在 队列 尾 端 。 

ptr 参数 指向 一 个 长 整 型 数 , 它 包 含 了 正 的 整 型 消息 类 型 , 其 后 紧 接 着 的 是 消息 数据 E nbytes 
是 0， 则 无 消息 数据 )。 若 发 送 的 最 长 消息 是 512 字 节 的 ， 则 可 定义 下 列 结构 : 


struct mymesg { 

long mtype; /* positive message type */ 

char mtext[512]; /* message data, of length nbytes */ 
Hu 


ptr 就 是 一 个 指向 mymesg 结构 的 指针 。 接 收 者 可 以 使 用 消息 类 型 以 非 先进 先 出 的 次 序 取消 息 。 


REPE X 4432 位 环境 ， 又 支持 64 位 环境 。 这 影响 到 长 整 型 和 指针 的 大 小 。 例 如 ， 在 64 
位 SPARC AHP, Solaris 允许 32 位 应 用 程序 和 64 位 应 用 程序 同时 存在 。 如 果 一 个 32 位 应 用 程 
序 要 经 由 管道 或 套 接 字 与 一 个 64 位 应 用 程序 交换 此 结构 ， 就 会 出 问题 。 因 为 在 32 位 应 用 程序 中 ， 
长 整 型 的 大 小 是 4 字 节 ， 而 在 64 位 应 用 程序 中 ， 长 整 型 的 大 小 是 8 字 节 。 这 意味 着 ，32 位 应 用 
程序 期 望 mtext 字段 在 结构 起 始 地 址 后 的 第 4 个 字 节 处 开始 , 而 64 位 应 用 程序 则 期 望 mtext F 
| 段 在 结构 起 始 地 址 后 的 第 8 个 字 节 处 开始 。 在 这 种 情况 下 ，64 位 应 用 程序 的 mtype 字段 的 一 部 
| 分 会 被 32 位 应 用 程序 视 为 mtext 字段 的 组 成 部 分 ， 而 32 位 应 用 程序 的 mtext 字段 的 前 4 个 字 
| 节 会 被 64 位 应 用 程序 解释 为 mtype 宇 段 的 组 成 部 分 。 
| 但 是 ，XSI 消息 队列 就 不 会 发 生 这 种 问题 。Solaris 实现 的 IPC 系统 调用 的 32 位 版 本 和 64 位 
”1 版 本 具有 不 同 的 入 口 点 。 这 些 系统 调用 知道 如 何 处 理 32 位 应 用 程序 与 64 位 应 用 程序 的 通信 操作 ， 
| 并 对 类 型 字段 做 了 特殊 处 理 以 避免 它 干扰 消息 的 数据 部 分 。 唯 一 的 潜在 问题 是 ， 当 64 位 应 用 程序 
| 向 32 位 应 用 程序 发 送 消 息 时 ， 如 果 它 在 8 字 节 类 型 字段 中 设置 的 值 大 于 32 位 应 用 程序 中 4 FY 
| 类 型 字段 可 表示 的 值 ， 那 么 32 位 应 用 程序 在 其 mtype 字段 中 得 到 的 将 是 一 个 截 短 了 的 类 型 值 。 


参数 flag 的 值 可 以 指定 为 IPC_NOWAIT。 这 类 似 于 文件 VO 的 非 阻 塞 VO bris CH 14.2 节 )。 
若 消息 队列 已 满 (或 者 是 队列 中 的 消息 总 数 等 于 系统 限制 值 ， 或 队列 中 的 字 节 总 数 等 于 系统 限制 
值 )， 则 指定 IPC NOWAIT 使 得 msgsnd 立即 出 错 返 回 EAGRIN。 如 果 没 有 指定 IPC NOWAIT, 
则 进程 会 一 直 阻 塞 到 ， 有 空间 可 以 容纳 要 发 送 的 消息 ; 或 者 从 系统 中 删除 了 此 队列 ， 或 者 捕捉 到 
一 个 信和 号 ， 并 从 信和 号 处 理 程序 返回 。 在 第 二 种 情况 下 ， 会 返回 EIDRM 错误 (“标识 符 被 删除 ”)。 
最 后 一 种 情况 则 返回 EINTR 错误 。 563 


- 一 一 一 -> 一 一 一 = ewm 一 一 一 一 一 
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注意 ， 对 删除 消息 队列 的 处 理 不 是 很 完善 。 因 为 每 个 消息 队列 没有 维护 引用 计数 器 (打开 文 
件 有 这 种 计数 器 )， 所 以 在 队列 被 删除 以 后 ， 仍 在 使 用 这 一 队列 的 进程 在 下 次 对 队列 进行 操作 时 
会 出 错 返 回 。 信 和 号 量 机 构 也 以 同样 方式 处 理 其 删除 。 相 反 ， 删 除 一 个 文件 时 ， 要 等 到 使 用 该 文件 
的 最 后 一 个 进程 关闭 了 它 的 文件 描述 符 以 后 ， 才 能 删除 文件 中 的 内 容 。 

当 msgsnd 返回 成 功 时 ， 消 息 队 列 相 关 的 msqid_ds 结构 会 随 之 更 新 ， 表 明 调 用 的 进程 ID 
(msg_lspid)、 调 用 的 时 间 (msg_stime) 以 及 队列 中 新 增 的 消息 (msg qnum). 

msgrcv 从 队列 中 取 用 消息 。 


#include <sys/msg.h> 


ssize_t msgrcv(int msgid, void *ptr, size t nbytes, long type, int flag); 


BEE: 若 成 功 ， 返 回 消息 数据 部 分 的 长 度 ; 若 出 错 ， 返 回 -1 





fll msgsnd 一 样 ，ptr 参数 指向 一 个 长 整 型 数 (其 中 存储 的 是 返回 的 消息 类 型 )， 其 后 跟随 的 
是 存储 实际 消息 数据 的 缓冲 区 。nbytes 指定 数据 缓冲 区 的 长 度 。 若 返回 的 消息 长 度 大 于 nbytes, 
il] H.ZE flag 中 设置 了 MSG_NOERROR 位 ， 则 该 消息 会 被 截断 (在 这 种 情况 下 ， 没 有 通知 告诉 我 们 
消息 截断 了 ， 消 息 被 截 去 的 部 分 被 丢弃 )。 如 果 没 有 设置 这 一 标志 ， 而 消息 又 太 长 ， 则 出 错 返 回 

E2BIG《〈 消 息 仍 留 在 队列 中 )。 

参数 type 可 以 指定 想 要 哪 一 种 消息 。 

type = 0 返回 队列 中 的 第 一 个 消息 。 

type >0 返回 队列 中 消息 类 型 为 ype 的 第 一 个 消息 。 

tzype <0 返回 队列 中 消息 类 型 值 小 于 等 于 ope 绝对 值 的 消息 ， 如 果 这 种 消息 有 若干 个 ， 则 

取 类 型 值 最 小 的 消息 。 

type 值 非 0 用 于 以 非 先 进 先 出 次 序 读 消息 。 例 如 ， 若 应 用 程序 对 消息 赋予 优先 权 ， 那 么 ype 
就 可 以 是 优先 权 值 。 如 果 一 个 消息 队列 由 多 个 客户 进程 和 一 个 服务 器 进程 使 用 ， 那 么 type 字段 可 
以 用 来 包含 客户 进程 的 进程 D (只 要 进程 ID 可 以 存放 在 长 整 型 中 )。 

可 以 将 flag 值 指定 为 IPC_NOWAIT， 使 操作 不 阻塞 ， 这 样 ， 如 果 没 有 所 指定 类 型 的 消息 可 用 ， 
则 msgrcv 返回 一 1，error 设置 为 ENOMSG。 如 果 没 有 指定 IPC_NOWAIT， 则 进程 会 一 直 阻 塞 
到 有 了 指定 类 型 的 消息 可 用 , 或 者 从 系统 中 删除 了 此 队列 (返回 一 1，error 设置 为 EIDRM), 或 
者 捕 提 到 一 个 信号 并 从 信号 处 理 程序 返回 (这 会 导致 msgrcv 返回 一 1!，errno REN EINTR). 

msgrcv 成 功 执行 时 ,内核 会 更 新 与 该 消息 队列 相关 联 的 msgid_ds 结构 , 以 指示 调用 者 的 进程 
ID (msg lrpid) 和 调用 时 间 (msg_rtime)， 并 指示 队列 中 的 消息 数 减 少 了 1 个 (msg_qnum)。 


^a A 消息 队列 与 全 双 工 管道 的 时 间 比 较 


如 若 需 要 客户 进程 和 服务 器 进程 之 间 的 双向 数据 流 ， 可 以 使 用 消息 队列 或 全 双 工 管道 。( 回 
忆 图 15-1, 通过 UNIX 域 套 接 字 机 制 , 见 17.2 节 , 可 以 使 全 双 工 管道 可 用 , 而 某 些 平台 通过 pipe 
函数 提供 全 双 工 管道 。) 

15-27 显示 了 在 Solaris 上 3 种 技术 在 时 间 方 面 的 比较 ， 这 3 种 技术 是 : 消息 队列 、 全 双 工 
(STREAMS) 管道 和 UNIX 域 套 接 字 。 测 试 程序 先 创建 IPC 通道 ， 调 用 fork， 然 后 从 父 进程 向 
子 进程 发 送 约 200 MB 数据 。 数 据 发 送 的 方式 是 : 对 于 消息 队列 ， 调 用 100000 次 msgshd， 每 个 
消息 长 度 为 2 000 字 节 ; 对 于 全 双 工 管道 和 UNIX 域 套 接 字 ， 调 用 100 000 次 write, 每 次 写 2 000 
字 节 。 时 间 都 以 秒 为 单位 。 
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消息 队列 0.58 4.16 5.09 
全 双 工 管道 0.61 4.30 5.24 
UNIX REIF 0.59 5.58 

15-27 在 Solaris 上 3 种 IPC 的 时 间 比 较 
从 这 些 数字 中 可 见 ， 消 息 队 列 原来 的 实施 目的 是 提供 高 于 一 般 速 度 的 IPC， 但 现在 与 其 他 形 
式 的 IPC 相 比 ， 在 速度 方面 已 经 没有 什么 差别 了 。( 在 原来 实施 消息 队列 时 ， 可 用 的 其 他 形式 的 
IPC 就 只 有 半 双 工 管道 这 一 种 。) 考虑 到 使 用 消息 队列 时 遇 到 的 问题 〈 见 15.6.4 节 )， 我 们 得 出 的 
结论 是 ， 在 新 的 应 用 程序 中 不 应 当 再 使 用 它们 。 a 


15.8 信号 量 


信号 量 与 已 经 介绍 过 的 IPC 机 构 〈 管 道 、FIFO 以 及 消息 列队 ) 不 同 。 它 是 一 个 计数 器 ， 用 
于 为 多 个 进程 提供 对 共享 数据 对 象 的 访问 。 


Single UNIX Specification 包括 了 另外 一 套 信 号 量 接口 ， 该 接口 原来 是 实时 扩展 的 一 部 分 。 我 
| 们 将 在 15.10 节 讨论 这 种 接口 。 


为 了 获得 共享 资源 ， 进 程 需要 执行 下 列 操作 。 

《1 测试 控制 该 资源 的 信号 量 。 

(2) 若 此 信号 量 的 值 为 正 ， 则 进程 可 以 使 用 该 资源 。 在 这 种 情况 下 ， 进 程 会 将 信号 量 值 减 1， 
表示 它 使 用 了 一 个 资源 单位 。 

(3) 否则 ， 若 此 信号 量 的 值 为 0， 则 进程 进入 休眠 状态 ， 直 至 信号 量 值 大 于 0。 进 程 被 唤醒 
后 ， 它 返回 至 步骤 O). 

当 进 程 不 再 使 用 由 一 个 信和 号 量 控制 的 共享 资源 时 ， 该 信号 量 值 增 1。 如 果 有 进程 正在 休眠 等 
待 此 信号 量 ， 则 唤醒 它们 。 

为 了 正确 地 实现 信号 量 ， 信 号 量 值 的 测试 及 减 1 操作 应 当 是 原子 操作 。 为 此 ， 信 号 量 通 常 是 
在 内 核 中 实现 的 。 

常用 的 信号 量 形式 被 称 为 二 元 信号 量 (binary semaphore)。 它 控制 单个 资源 ， 其 初始 值 为 1。 但 
是 ， 一 般 而 言 ， 信 号 量 的 初 值 可 以 是 任意 一 个 正 值 ， 该 值 表明 有 多 少 个 共享 资源 单位 可 供 共享 应 用 。 

遗憾 的 是 ，XSI 信号 量 与 此 相 比 要 复杂 得 多 。 以 下 3 种 特性 造成 了 这 种 不 必要 的 复杂 性 。 

(1) 信号 量 并 非 是 单个 非 负 值 ， 而 必需 定义 为 含有 一 个 或 多 个 信号 量 值 的 集合 。 当 创建 信号 
量 时 ， 要 指定 集合 中 信号 量 值 的 数量 。 

(2) 信号 量 的 创建 (semget) 是 独立 于 它 的 初始 化 〈semct1) 的 。 这 是 一 个 致命 的 缺点 ， 
因为 不 能 原子 地 创建 一 个 信号 量 集合 ， 并 且 对 该 集合 中 的 各 个 信号 量 值 赋 初 值 。 

(3〉 即 使 没有 进程 正在 使 用 各 种 形式 的 XSI IPC， 它 们 仍然 是 存在 的 。 有 的 程序 在 终止 时 并 
没有 释放 已 经 分 配给 它 的 信号 量 ， 所 以 我 们 不 得 不 为 这 种 程序 担心 。 后 面 将 村 说 明 的 undo 功能 
就 是 处 理 这 种 情况 的 。 

内 核 为 每 个 信号 量 集合 维护 着 一 个 semid_ds 结构 : 


struct semid ds { 
struct ipc_perm sem perm; /* see Section 15.6.2 */ 
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unsigned short sem nsems;  /* # of semaphores in set */ 
time t sem otime;  /* last-semop() time */ 


time t sem ctime;  /* last-change time */ 


}; 

Single UNIX Specification 定义 了 上 面 所 示 的 各 字段 ， 但 是 具体 实现 可 在 semid ds 结构 中 定 
义 添 加 的 成 员 。 

每 个 信号 量 由 一 个 无 名 结构 表示 ， 它 至 少 包含 下 列 成 员 : 


struct 1 
unsigned short semval; /* semaphore value, always >= 0 */ 
pid_t sempid; /* pid for last operation */ 
unsigned short semncnt; /* # processes awaiting semval>curval */ 
unsigned short semzcnt; /* # processes awaiting semval==0 */ 


}; 
图 15-28 列 出 了 影响 信号 量 集合 的 系统 限制 。 


任 一 信号 量 的 最 大 值 。 | 
任 一 信号 量 的 最 大 退出 时 的 调整 值 


系统 中 信号 量 集 的 最 大 数量 
系统 中 信和 号 量 的 最 大 数量 

每 个 信号 量 集 中 的 信号 量 的 最 大 数量 
系统 中 undo 结构 的 最 大 数量 

每 个 undo 结构 中 undo 项 的 最 大 数量 
每 个 semop 调用 中 操作 的 最 大 数量 


15-28 ”影响 信号 量 的 系统 限制 
当 我 们 想 使 用 XSI 信号 量 时 ， 首 先 需 要 通过 调用 消 数 semget 来 获得 一 个 信和 号 量 D. 


#include <sys/sem.h> 





int semget(key t key, int nsems, int flag); 





返回 值 ， 若 成 功 ， 返 回信 号 量 ID， 若 出 错 ， 返 回 一 ! 


15.6.1 节 说 明了 将 key 变换 为 标识 符 的 规则 ,讨论 了 是 创建 一 个 新 集合 , 还 是 引用 一 个 现 有 集合 
创建 一 个 新 集合 时 ， 要 对 semid_ds 结构 的 下 列 成 员 赋 初 值 。 

e 4215.62 节 中 所 述 ， 初 始 化 ipc perm 结构 。 该 结构 中 的 mode 成 员 被 设置 为 flag 中 的 

相应 权限 位 。 这 些 权限 是 用 图 15-24 中 的 值 设 置 的 。 

e sem otime 设置 为 0。 

e sem ctime 设置 为 当前 时 间 。 

e sem nsems 设置 为 nsems. 

nsems 是 该 集合 中 的 信和 号 量 数 。 如 果 是 创建 新 集合 cub 则 必须 指定 nsems 
如 果 是 引用 现 有 集合 〈 一 个 客户 进程 )， 则 将 nsems 指定 为 0。 

semctl 函数 包含 了 多 种 信号 量 操作 。 
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#include <sys/sem.h> 


int semctl(int semid, int semnum, int cmd, ... /* union semun arg */); 





第 4 个 参数 是 可 选 的， 是 否 使 用 取决 于 所 请 求 的 命令 ， 如 果 使 用 该 参数 ， 则 其 类 型 是 semun， 
它 是 多 个 命令 特定 参数 的 联合 Cunion): 


union semun { 
int val; /* for SETVAL */ 
struct semid ds *buf; /* for IPC STAT and IPC SET */ 
unsigned short *array; /* for GETALL and SETALL */ 


}e 567 
注意 ， 这 个 选项 参数 是 一 个 联合 ， 而 非 指向 联合 的 指针 。 
| 通常 应 用 程序 必须 定义 semun 联合 。 然 而 ， 在 FreeBSD 80 中 ，semun 已 经 由 <sys/sem.h> 
， 为 我 们 定义 好 了 。 
cmd 参数 指定 下 列 10 种 命令 中 的 一 种 ， 这 些 命令 是 运行 在 semid 指定 的 信号 量 集 合 上 的 。 其 
中 有 5 种 命令 是 针对 一 个 特定 的 信号 量 值 的 ， 它 们 用 semnum 指定 该 信号 量 集 合 中 的 一 个 成 员 。semnum 
值 在 0 和 nsems—1 ZA, H 0 和 nsems— 1. 
IPC STAT ”对 此 集合 取 semid ds 结构 ， 并 存储 在 由 arg. buf 指向 的 结构 中 。 
IPC SET 按 arg. buf 指向 的 结构 中 的 值 ， 设 置 与 此 集合 相关 的 结构 中 的 sem perm.uid. 
sem perm.gid 和 sem_perm.mode 字段 。 此 命令 只 能 由 两 种 进程 执行 : 一 
种 是 其 有 效用 户 ID 等 于 sem perm.cuid RM sem perm.uid 的 进程 ， 另 一 
种 是 具有 超级 用 户 特 权 的 进程 。 
IPC RMID ”从 系统 中 删除 该 信号 量 集合 。 这 种 删除 是 立即 发 生 的 。 删 除 时 仍 在 使 用 此 信 
号 量 集 合 的 其 他 进程 ， 在 它们 下 次 试图 对 此 信号 量 集合 进行 操作 时 ， 将 出 错 
返回 EIDRM。 此 命令 只 能 由 两 种 进程 执行 ， 一 种 是 其 有 效用 户 ID 等 于 sem_ 
perm. cuid Ei sem perm.uid 的 进程 ; 男 一 种 是 具有 超级 用 户 特 权 的 进程 。 


GETVAL 返回 成 员 semnum 的 semval 值 。 
SETVAL 设置 成 员 semnum 的 semval 值 。 该 值 由 arg.val 指定 。 
GETPID 返回 成 员 semnum 的 sempid f& . 


GETNCNT 返回 成 员 semnum 的 semncnt 值 。 

GETZCNT 返回 成 员 semnum 的 semzcnt 值 。 

GETALL 取 该 集合 中 所 有 的 信号 量 值 。 这 些 值 存储 在 arg.array 指向 的 数组 中 。 

SETALL 将 该 集合 中 所 有 的 信号 量 值 设置 成 arg.array 指向 的 数组 中 的 值 。 

对 于 除 GETALL 以 外 的 所 有 GET HS, semct] 函数 都 返回 相应 值 。 对 于 其 他 命令 ， 若 成 功 
则 返回 值 为 0， 若 出 错 ， 则 设置 errno 并 返回 -1。 

函数 semop 自动 执行 信号 量 集合 上 的 操作 数组 。 


#include <sys/sem.h> 


int semop(int semid, struct sembuf semoparray[], size_t mops): 


REHE: Ape, WIPO: AP. A0- 
BR semoparray 是 一 个 指针 ， 它 指向 一 个 由 sembuf 结构 表示 的 信和 号 量 操作 数组 : 568 
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struct sembuf { 


unsigned short sem num; /* member # in set (0, 1, ..., nsems-1 */ 
short sem op; /* operation (negative, 0,or pasitive */) 
short sem flg; /* IPC NOWAIT, SEM UNDO */ 


}? 
参数 nops 规定 该 数组 中 操作 的 数量 (元 素数 )。 
对 集合 中 每 个 成 员 的 操作 由 相应 的 sem. op 值 规定 。 此 值 可 以 是 负 值 、0 或 正 值 。( 下 面 的 讨 
论 将 提 到 信号 量 的 “undo” 标 志 。 此 标志 对 应 于 相应 的 sem_f1g 成 员 的 SEM, UNDO 位 。) 
(1) 最 易于 处 理 的 情况 是 sem op 为 正 值 。 这 对 应 于 进程 释放 的 占用 的 资源 数 。sem_op f& 
会 加 到 信号 量 的 值 上 。 如 果 指 定 了 undo 标志 ， 则 也 从 该 进程 的 此 信号 量 调 整 值 中 减 去 sem op. 
(2) X sem op 为 负 值 ， 则 表示 要 获取 由 该 信号 量 控制 的 资源 。 
如 车 该 信号 量 的 值 大 于 等 于 sen op 的 绝对 值 (具有 所 需 的 资源 )， 则 从 信号 量 值 中 减 去 sem op 
的 绝对 值 。 这 能 保证 信号 量 的 结果 值 大 于 等 于 0。 如 果 指 定 了 undo 标志 ， 则 sem op 的 绝对 值 也 
加 到 该 进程 的 此 信和 号 量 调整 值 上 。 
如 果 信 号 量 值 小 于 sem op 的 绝对 值 〈 资 源 不 能 满足 要 求 )， 则 适用 下 列 条 件 。 
a、 若 指定 了 IPC_NOWRIT， 则 semop 出 错 返 回 EAGAIN. 
b. HABE IPC_NOWAIT， 则 该 信号 量 的 semncnt 值 加 1 《因为 调用 进程 将 进入 休眠 状 
态 )， 然 后 调用 进程 被 挂 起 直至 下 列 事 件 之 一 发 生 。 
i. 此 信号 量 值 变 成 大 于 等 于 sem op 的 绝对 值 《 即 某 个 进程 已 释放 了 某 些 资源 )。 此 信和 号 
HH semncnt 值 减 1 (因为 已 结束 等 待 )， 并 且 从 信和 号 量 值 中 减 去 sem op 的 绝对 值 。 
如 果 指 定 了 undo 标志 ， 则 sem op 的 绝对 值 也 加 到 该 进程 的 此 信号 量 调整 值 上 。 
ii、 从 系统 中 删除 了 此 信号 量 。 在 这 种 情况 下 ， 函 数 出 错 返回 EIDRM。 
iii. 进程 捕捉 到 一 个 信号 , 并 从 信号 处 理 程序 返回 , 在 这 种 情况 下 , 此 信号 量 的 semncnt 
值 减 1 〈 因 为 调用 进程 不 再 等 待 )， 并 且 函 数 出 错 返 回 EINTR。 
(3) Æ sem op 为 0， 这 表示 调用 进程 希望 等 待 到 该 信号 量 值 变 成 0。 
如 果 信 和 号 量 值 当前 是 0， 则 此 函数 立即 返回 。 
如 果 信 号 量 值 非 0， 则 适用 下 列 条 件 。 
a， 若 指定 了 IPC_NOWAIT， 则 出 错 返 回 EAGAIN。 
b. 若 未 指定 IPC_NOWAIT， 则 该 信号 量 的 semzcnt 值 加 1 (因为 调用 进程 将 进入 休眠 状 
态 )， 然 后 调用 进程 被 挂 起 ， 直 至 下 列 的 一 个 事件 发 生 。 
i， 此 信号 量 值 变 成 0。 此 信和 号 量 的 semzcnt 值 减 1 (因为 调用 进程 已 结束 等 待 )。 
i. 从 系统 中 删除 了 此 信号 量 。 在 这 种 情况 下 ， 函 数 出 错 返 回 EIDRM。 
iii. 进程 捕捉 到 一 个 信号 ,并 从 信和 号 处 理 程序 返回 。 在 这 种 情况 下 , 此 信号 量 的 semzcnt 
值 减 1〈 因 为 调用 进程 不 再 等 待 )， 并 且 函 数 出 错 返 回 EINTR. 
semop 函数 具有 原子 性 ， 它 或 者 执行 数组 中 的 所 有 操作 ， 或 者 一 个 也 不 做 。 
exit 时 的 信号 量 调整 
正如 前 面 提 到 的 ， 如 果 在 进程 终止 时 ， 它 占用 了 经 由 信号 量 分 配 的 资源 ， 那 么 就 会 成 为 一 个 
问题 。 无 论 何 时 只 要 为 信号 量 操作 指定 了 SEM UNDO 标志 ， 然 后 分 配 资源 (sem op 值 小 于 0), 
那么 内 核 就 会 记 住 对 于 该 特定 信号 量 ， 分 配给 调用 进程 多 少 资 源 (sem_op 的 绝对 值 )。 当 该 进程 
终止 时 ， 不 论 自愿 或 者 不 自愿 ， 内 核 都 将 检验 该 进程 是 否 还 有 尚未 处 理 的 信号 量 调整 值 ， 如 果 有 ， 
则 按 调 整 值 对 相应 信号 量 值 进行 处 理 。 
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如 果 用 带 SETVAL 或 SETALL 命令 的 semct1 设置 一 个 信号 量 的 值 ， 则 在 所 有 进程 中 , 该 信 
号 量 的 调整 值 都 将 设置 为 0。 


二 实例; 信号 量 、 记 录 锁 和 互 斥 量 的 时 间 比 较 


如 果 在 多 个 进程 间 共 享 一 个 资源 ， 则 可 使 用 这 3 种 技术 中 的 一 种 来 协调 访问 。 我 们 可 以 使 用 
BRET BPRS ER hE Se PAS. CRRA AR. WKS 种 技术 两 两 之 间 在 时 间 上 的 差 
别 进行 比较 是 有 益 的 。 

车 使 用 信号 量 ， 则 先 创建 一 个 包含 一 个 成 员 的 信号 量 集合 ， 然 后 将 该 信号 量 值 初始 化 为 1。 
为 了 分 配 资 源 ， 以 sem op 为 一 1 调用 semop。 为 了 释放 资源 ， 以 sem op 为 +1 调用 semop。 对 
每 个 操作 都 指定 SEM_UNDO， 以 处 理 在 未 释放 资源 条 件 下 进程 终止 的 情况 。 

车 使 用 记录 锁 ， 则 先 创建 一 个 空 文件 ， 并 且 用 该 文件 的 第 一 个 字 节 无 需 存在 作为 锁 字 节 。 
为 了 分 配 资源 ， 先 对 该 字 节 获得 一 个 写 锁 。 释 放 该 资源 时 ， 则 对 该 字 节 解锁 。 记 录 锁 的 性 质 确保 
了 当 一 个 锁 的 持 有 者 进程 终止 时 ， 内 核 会 自动 释放 该 锁 。 

车 使 用 互 斥 量 ， 需 要 所 有 的 进程 将 相同 的 文件 映射 到 它们 的 地 址 空间 里 ， 并 且 使 用 PTHREAD_ 
PROCESS SHARED 互 斥 量 属性 在 文件 的 相同 偏 移 处 初始 化 互 斥 量 。 为 了 分 配 资源 ， 我 们 对 互 斥 量 加 
锁 。 为 了 释放 锁 ， 我 们 解锁 互 斥 量 。 如 果 一 个 进程 没有 释放 互 斥 量 而 终止 ,恢复 将 是 非常 困难 的 ， 除 
非 我们 使 用 鲁 棒 互 斥 量 (回忆 12.4.1 节 中 讨论 的 pthread_mutex_consistent A. 

图 15-29 显示 了 在 Linux 上 ， 使 用 这 3 种 不 同 技术 进行 锁 操 作 所 需 的 时 间 。 在 每 一 种 情况 下 ， 
资源 都 被 分 配 、 释 放 1 000 000 次 。 这 同时 由 3 个 不 同 的 进程 执行 。 图 15-29 中 所 示 的 时 间 是 3 个 
进程 的 总 计 ， 单 位 是 秒 。 


带 undo 的 信号 量 0.50 6.08 7.55 
建议 性 记录 锁 0.51 9.06 4.38 
共享 存储 中 的 互 斥 量 0.21 0.40 0.25 


15-29 Linux 上 锁 替 代 技 术 的 时 间 比 较 


在 Linux 上 ,记录 锁 比 信 号 量 快 , 但 是 共享 存储 中 的 互 斥 量 的 性 能 比 信号 量 和 记录 锁 的 都 要 优越 。 
如 果 我 们 能 单一 资源 加 锁 ， 并 且 不 需要 XSI 信号 量 的 所 有 人 花哨 功能 ， 那 么 记录 锁 将 比 信号 量 要 好 。 原 
因 是 它 使 用 起 来 更 简单 、 速 度 更 快 《在 这 个 平台 上 )， 当 进程 终止 时 系统 会 管理 遗留 下 来 的 锁 。 尽 管 对 
于 这 种 平台 来 说 ， 在 共享 存储 中 使 用 互 斥 量 是 一 个 更 快 的 选择 ， 但 是 我 们 依然 喜欢 使 用 记录 锁 ， 除 非 
要 特别 考虑 性 能 。 这 样 做 有 两 个 原因 。 首 先 ， 在 多 个 进程 间 共 享 的 内 存 中 使 用 互 斥 量 来 恢复 一 个 终止 
的 进程 更 难 。 其 次 ， 进 程 共享 的 互 斥 量 属性 还 没有 得 到 普遍 支持 。 在 Single UNIX Specification 的 老 版 
本 中 ， 这 是 可 选 的 。 尽 管 在 SUSv4 中 依然 是 可 选 的 ， 但 是 现在 ， 所 有 遵循 XSI 的 实现 都 要 求 使 用 它 。 


在 本 书 讨论 的 4 个 平台 中 ， 只 有 Linux 3.2.0 和 Solaris 10 当前 支持 进程 共享 的 互 斥 量 属性 。 " 


15.9 ”共享 存储 


共享 存储 允许 两 个 或 多 个 进程 共享 一 个 给 定 的 存储 区 。 因 为 数据 不 需要 在 客户 进程 和 服务 器 
进程 之 间 复 制 ， 所 以 这 是 最 快 的 一 种 IPC。 使 用 共享 存储 时 要 掌握 的 唯一 穿 门 是 ， 在 多 个 进程 之 
间 同 步 访 问 一 个 给 定 的 存储 区 。 车 服务 器 进程 正在 将 数据 放 入 共享 存储 区 ， 则 在 它 做 完 这 一 操作 
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之 前 ， 客 户 进程 不 应 当 去 取 这 些 数据 。 通 常 ， 信 号 量 用 于 同步 共享 存储 访问 。( 不 过 正如 前 节 最 
后 部 分 所 述 ， 也 可 以 用 记录 锁 或 互 斥 量 。) 
| Single UNIX Specification 在 其 共享 存储 对 象 选项 中 包括 了 访问 共享 存储 的 赫 代 接口 ， 这 些 接 
| 口 源 于 实时 扩展 。 本 书 不 讨论 这 些 接口 。 
我 们 已 经 看 到 了 共享 存储 的 一 种 形式 ， 就 是 在 多 个 进程 将 同一 个 文件 映射 到 它们 的 地 址 空间 
的 时 候 。XSI 共享 存储 和 内 存 映 射 的 文件 的 不 同 之 处 在 于 ， 前 者 没有 相关 的 文件 。XSI 共享 存储 
段 是 内 存 的 匿名 段 。 
内 核 为 每 个 共享 存储 段 维 护 着 一 个 结构 ， 该 结构 至 少 要 为 每 个 共享 存储 段 包 含 以 下 成 员 : 


struct shmid ds 1 


struct ipc perm shm perm; /* see Section 15.6.2 */ 

size t shm segsz; /* size of segment in bytes */ 
pid t shm lpid; /* pid of last shmop() */ 

pid t shm cpid; /* pid of creator */ 

shmatt t shm nattch; /* number of current attaches */ 
time t shm atime; /* last-attach time */ 

time t shm_dtime; /* last-detach time */ 

time_t shm ctime; /* last-change time */ 


}? 
(按照 支持 共享 存储 段 的 需要 ， 每 种 实现 会 增加 其 他 结构 成 员 。) 

shmatt t 类 型 定义 为 无 符号 整 型 ， 它 至 少 与 unsigned short 一 样 大 。 图 15-30 列 出 了 影 
啊 共 享 存 储 的 系统 限制 。 


共享 存储 段 的 最 大 字 节 长 度 。 33 554 z 32 m 

共享 存储 段 的 最 小 字 节 长 度 

系统 中 共享 存储 段 的 最 大 段 数 B üi : 人 
每 个 进程 共享 存储 段 的 最 大 段 数 128 4 096 


图 15-30 ”影响 共享 存储 的 系统 限制 
调用 的 第 一 个 函数 通常 是 shmget， 它 获得 一 个 共享 存储 标识 符 。 


#include <sys/shm.h> 





int shmget(key t key, size_t size, int flag); 





15.6.1 节 说 明了 将 key 变换 成 一 个 标识 符 的 规则 ， rar renee 还 是 引用 
一 个 现 有 的 共享 存储 段 。 当 创建 一 个 新 段 时 ， 初 始 化 shmid ds 结构 的 下 列 成 员 。 
e ipc_perm 结构 按 15.6.2 节 中 所 述 进行 初始 化 。 该 结构 中 的 mode TZ flag 中 的 相应 权限 位 
设置 。 这 些 权 限 用 图 15-24 中 的 值 指定 。 
e shm lpid. shm nattach、shm_atime 和 shm dtime 都 设置 为 0。 
e shm_ctime 设置 为 当前 时 间 。 
e shm segsz 设置 为 请 求 的 size. 
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参数 size 是 该 共享 存储 段 的 长 度 ,， 以 字 节 为 单位 。 实 现 通常 将 其 向 上 取 为 系统 页 长 的 整 倍 数 。 
但 是 ， 若 应 用 指定 的 size 值 并 非 系统 页 长 的 整 倍数 ， 那 么 最 后 一 页 的 余下 部 分 是 不 可 使 用 的 。 如 
果 正 在 创建 一 个 新 段 (通常 在 服务 器 进程 中 ), 则 必须 指定 其 size. 如果 正 在 引用 一 个 现存 的 段 (一 
个 客户 进程 );， 则 将 size 指定 为 0。 当 创 建 一 个 新 段 时 ， 段 内 的 内 容 初始 化 为 0。 

shmctl 图 数 对 共享 存储 段 执行 多 种 操作 。 


#include <sys/shm.h> 


int shmctl(int shmid, int cmd, struct shmid_ds *buf): 





返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


cmd 参数 指定 下 列 5 种 命令 中 的 一 种 ， 使 其 在 shmid 指定 的 段 上 执行 。 

IPC_STAT 取 此 段 的 shmiq_as 结构 ， 并 将 它 存储 在 由 buf 指 向 的 结构 中 。 

IPC_SET f£ buf 指向 的 结构 中 的 值 设 置 与 此 共享 存储 段 相关 的 shmid ds 结构 中 的 下 
列 3 个 字段 ，shm_perm.uid、shm perm.gid 和 shm perm.mode。 此 命 
令 只 能 由 下 列 两 种 进程 执行 ; 一 种 是 其 有 效用 户 ID 等 于 shm_perm.cuid 或 
shm perm. uid 的 进程 ， 田 一 种 是 具有 超级 用 户 特 权 的 进程 。 

IPC_RMID ”从 系统 中 删除 该 共享 存储 段 。 因 为 每 个 共享 存储 段 维护 着 一 个 连接 计数 
(shmid ds 结构 中 的 shm_nattch 字段 )， 所 以 除非 使 用 该 段 的 最 后 一 个 进 
程 终止 或 与 该 段 分 离 ， 否 则 不 会 实际 上 删除 该 存储 段 。 不 管 此 段 是 否 仍 在 使 
用 ， 该 段 标 识 符 都 会 被 立即 删除 ， 所 以 不 能 再 用 shmat 与 该 段 连接 。 此 命令 
只 能 由 下 列 两 种 进程 执行 ; 一 种 是 其 有 效用 户 ID 等 于 shm perm.cuid 或 
shm perm.uid 的 进程 ， 另 一 种 是 具有 超级 用 户 特 权 的 进程 。 

Linux 和 Solaris 提供 了 另外 两 种 命令 ， 但 它们 并 非 Single UNIX Specification 的 组 成 部 分 。 

SHM_LOCK 在 内 存 中 对 共享 存储 段 加 锁 。 此 命令 只 能 由 超级 用 户 执行 。 

SHM UNLOCK ”解锁 共享 存储 段 。 此 命令 只 能 由 超级 用 户 执 行 。 

一 旦 创建 了 一 个 共享 存储 段 ， 进 程 就 可 调用 shmat 将 其 连接 到 它 的 地 址 空间 中 。 


finclude «sys/shm.h» 


void *shmat(int shmid, const void *addr, int flag); 


返回 值 ， 若 成 功 ， 返 回 指向 共享 存储 段 的 指针 ; 着 出 错 ， 返 回 -1 





共享 存储 段 连接 到 调用 进程 的 哪个 地 址 上 与 addr 参数 以 及 flag PEATE SHM_RND 位 有 关 。 
© WR addr 为 0， 则 此 段 连 接 到 由 内 核 选 择 的 第 一 个 可 用 地 址 上 。 这 是 推荐 的 使 用 方式 。 
e WẸ addr 非 0， 并 且 没 有 指定 SHM_RND， 则 此 段 连 接 到 addr 所 指定 的 地 址 上 。 
e WẸ addr 非 0， 并 且 指 定 了 SHM_RND， 则 此 段 连接 到 (addr 一 (addr mod SHMLBA) 所 
表示 的 地 址 上 。SHM_RND 命令 的 意思 是 “ 取 整 ”SHMLBA 的 意思 是 “ 低 边 界 地 址 倍数 ”， 
它 总 是 2 的 乘 方 。 该 算式 是 将 地 址 向 下 取 最 近 1 个 SHMLBA 的 倍数 。 
除非 只 计划 在 一 种 硬件 上 运行 应 用 程序 (这 在 当今 是 不 大 可 能 的 )， 和 否则 不 应 指定 共享 存储 
段 所 连接 到 的 地 址 。 而 是 应 当 指 定 addr 为 0， 以 便 由 系统 选择 地 址 。 
如 果 在 flag 中 指定 了 SHM_RDONLY 位 ， 则 以 只 读 方 式 连接 此 段 ， 否 则 以 读 写 方式 连接 此 段 。 
shmat 的 返回 值 是 该 段 所 连接 的 实际 地 址 ， 如 果 出 错 则 返回 一 1。 如 果 shmat 成 功 执行 ， 那 
么 内 核 将 使 与 该 共享 存储 段 相 关 的 shmid_ds 结构 中 的 shm_nattch 计数 器 值 加 1。 
当 对 共享 存储 段 的 操作 已 经 结束 时 ， 则 调用 shmdt 与 该 段 分 离 。 注 意 ， 这 并 不 从 系统 中 删除 
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其 标识 符 以 及 其 相关 的 数据 结构 。 该 标识 符 仍 然 存在 ， 直 至 某 个 进程 〈 一 般 是 服务 器 进程 》 带 
IPC RMID 命令 的 调用 shmct1l 特地 删除 它 为 止 。 
finclude <sys/shm.h> 


int shmdt(const void *addr); 





返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


addr 参数 是 以 前 调用 shmat 时 的 返回 值 。 如 果 成 功 ，shmdt 将 使 相关 shmid_ds 结构 中 的 
shm nattch 计数 器 值 减 1。 


Ba 实例 
内 核 将 以 地 址 0 连接 的 共享 存储 段 放 在 什么 位 置 上 与 系统 密切 相关 。 图 15-31 中 的 程序 打印 
574) 了 一 些 特 定 系 统 存 放 各 种 类 型 的 数据 的 位 置信 息 。 


#include "apue.h" 
#include «sys/shm.h» 


#define ARRAY, SIZE 40000 
#define MALLOC SIZE 100000 


$define SHM SIZE 100000 

#define SHM MODE 0600 /* user read/write */ 

char array [ARRAY_SIZE]; /* uninitialized data = bss */ 
int 


main (void) 
{ 
int shmid; 
char *ptr, *shmptr; 


printf("array[] from %p to tp\n", (void *)&array[0], 
(void *)&array[ARRAY SIZE]):; 
printf("stack around tp\n", (void *)&shmid); 


if ((ptr = malloc(MALLOC SIZE)) == NULL) 
err sys("malloc error"); 
printf("malloced from $p to %p\n", (void *)ptr, 
(void *)ptr-MALLOC SIZE); 


if ((shmid = shmget(IPC PRIVATE, SHM SIZE, SHM MODE)) < 0) 
err sys("shmget error"); 
if ((shmptr - shmat(shmid, 0, 0)) -- (void *)-1) 
err sys("shmat error"); 
printf("shared memory attached from tp to $pXn", (void *)shmptr, 
(void *)shmptr-*-SHM SIZE); 


if (shmctl(shmid, IPC RMID, 0) < 0} 
err sys("shmctl error"); 


exit (0): 


15-31 打印 各 种 类 型 的 数据 存放 的 位 置 
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在 一 个 基于 Intel 的 64 位 Linux 系统 上 运行 此 程序 ， 其 输出 如 下 : 


$ ./a.out 

array[] from 0x6020c0 to 0x60bd00 

stack around Ox7fff957b146c 

malloced from 0x9e3010 to Ox9fb6bO 

Shared memory attached from 0x7fba578ab000 to 0x7fba578c36a0 


图 15-32 显示 了 这 种 情况 ， 这 与 图 7-6 中 所 示 的 典型 存储 区 布局 类 似 。 注 意 ， 共 享 存储 段 紧 靠 在 
栈 之 下 。 


回忆 一 下 mmap 函数 《 见 14.8 节 )， 它 可 将 一 个 文件 的 若干 部 分 映射 至 进程 地 址 空间 。 这 在 
概念 上 类 似 于 用 shmat XSI IPC 函数 连接 一 个 共享 存储 段 。 两 者 之 间 的 主要 区 别 是 ， 用 mmap BR 
射 的 存储 段 是 与 文件 相关 联 的 ， 而 XSI 共享 存储 段 则 并 无 这 种 关联 。 


高 地 址 命令 行 会 数 
和 环境 变量 


0x7fff957b146c 







- 一 一 这 一 一 一 一 


0x7fba578c36a0 


} 100,000 字 节 的 共享 存储 
0x7fba578ab000 


未 初始 化 的 数据 
(bss) 
已 初始 化 的 数据 
omo 


图 15-32 ”在 基于 Intel 的 Linux 系统 上 的 存储 区 布局 


0x0000009e3010 
0x00000060bd00 


0x0000006020c0 







0x0000009fb6bO 
100,000 字 节 的 malloc 
40,000 字 节 的 array[ ] 


低地 址 


E SBA: /dev/zero 的 存储 映射 
共享 存储 可 由 两 个 不 相关 的 进程 使 用 。 但 是 ， 如 果 进 程 是 相关 的 ， 则 某 些 实现 提供 了 一 种 不 
同 的 技术 。 
| 直面 说 明 的 技术 用 于 FreeBSD 8.0、Linux 3.2.0 和 Solaris 10。Mac OS X 10.6.8 当前 并 不 支持 
| 将 字符 设备 映射 至 进程 地 址 空间 。 


在 读 设备 /dev/zero 时 ， 该 设备 是 0 字 节 的 无 限 资源 。 它 也 接收 写 向 它 的 任何 数据 ， 但 
又 忽略 这 些 数据 。 我 们 对 此 设备 作为 IPC 的 兴趣 在 于 ， 当 对 其 进行 存储 映射 时 ， 它 具有 一 些 
特殊 性 质 。 
。 创建 一 个 未 命名 的 存储 区 ， 其 长 度 是 mmap 的 第 二 个 参数 , 将 其 向 上 取 整 为 系统 的 最 近 页 长 。 
e 存储 区 都 初始 化 为 0。 
© 如 果 多 个 进程 的 共同 祖先 进程 对 mmap 指定 了 MAP SHARED 标志 ， 则 这 些 进程 可 共享 此 
存储 区 。 
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576 15-33 中 的 程序 是 使 用 此 特殊 设备 的 一 个 例子 。 


#include "apue.h" 
#include «fcntl.h» 
#include <sys/mman.h> 


#define NLOOPS 1000 
#define SIZE sizeof(long) /* size of shared memory area */ 


static int 
update (long *ptr) 
{ 


return ( (*ptr) ++); /* return value before increment */ 
} 
int 
main {void) 
{ 
“int fd, i, counter; 
pid t pid; 
void *area; 
if ((fd = open("/dev/zero", O RDWR)) < 0} 
err sys("open error"); 
if ((area = mmap(0, SIZE, PROT READ | PROT WRITE, MAP SHARED, 
fd, 0)) == MAP FAILED) 
err sys("mmap error"); 
close(fd); /* can close /dev/zero now that it's mapped */ 
TELL WAIT ():; 
if ((pid = fork()) < 0) { 
err Sys("fork error"); 
) else if (pid » O) ( /* parent */ 
for (i = 0; i < NLOOPS; i += 2) { 
if ((counter - update((long *)area)) !- i) 
err quit("parent: expected $d, got %d", i, counter); 
TELL CHILD(pid); 
WAIT CHILD(); 
) 
} else { /* child */ 
for {i = 1; i < NLOOPS + 1; i += 2) { 
WAIT_PARENT (); 
if ((counter = update((long *)area)) != i) 
err quit("child: expected %d, got td", i, counter); 
TELL_PARENT (getppid()); 
} 
} 
exit (0); 
} 





15-33 ”在 父 进程 、 子 进程 之 间 使 用 /dev/zero 的 存储 映射 VO 的 IPC 
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该 程序 打开 此 /dev/zero 设备 ， 然 后 指定 长 整 型 的 长 度 调用 mmap。 注 意 , 一 旦 存储 区 映射 
成 功 ， 我 们 就 要 关闭 (close) 此 设备 。 然后， 进程 创建 一 个 子 进程 。 因 为 在 调用 mmap 时 指定 
了 MAP_SHARED， 所 以 一 个 进程 写 到 存储 映射 区 的 数据 可 被 另 一 进程 见 到 。( 如 果 已 指定 
MRP_PRIVRATE， 则 此 程序 不 能 工作 。) 

然后 ， 父 进程 、 子 进程 交替 运行 ， 它 们 使 用 8.9 节 中 的 同步 函数 各 自 对 共享 存储 映射 区 中 的 
长 整 型 数 加 1。 存 储 映射 区 由 mmap 初始 化 为 0。 父 进程 先 对 它 进 行 增 1 操作 ， 使 其 成 为 1， 然后 
子 进程 对 其 进行 增 1 操作 ， 使 其 成 为 2， 然 后 父 进程 使 其 成 为 3， 依 此 类 推 。 注 意 ， 当 在 update 
函数 中 对 长 整 型 值 增 1 时 ， 因 为 增加 的 是 其 值 ， 而 不 是 指针 ， 所 以 必须 使 用 括号 。 

以 上 述 方 式 使 用 /dev/zero 的 优点 是 : 在 调用 mmap 创建 映射 区 之 前 ， 无 需 存 在 一 个 实际 


文件 。 映 射 /aev/zezro 自动 创建 一 个 指定 长 度 的 映射 区 。 这 种 技术 的 缺点 是 : 它 只 在 两 个 相关 - 


进程 之 间 起 作用 。 但 在 相关 进程 之 间 使 用 线程 可 能 更 为 简单 有 效 〈 见 第 11 章 和 第 12 章 )。 注 意 ， 
无 论 使 用 哪 一 种 技术 ， 都 需 对 共享 数据 进行 同步 访问 。 a" 


Su 实例 : BA ist 

很 多 实现 提供 了 一 种 类 似 于 /dev/zero 的 设施 ， 称 为 匿名 存储 映射 。 为 了 使 用 这 种 功能 ， 要 
在 调用 mmap 时 指定 MAP ANON 标志 ， 并 将 文件 描述 符 指定 为 一 1。 结 果 得 到 的 区 域 是 匿名 的 〈 因 
为 它 并 不 通过 一 个 文件 描述 符 与 一 个 路 径 和 名 相 结 合 )， 并 且 创 建 了 一 个 可 与 后 代 进 程 共 享 的 存储 区 。 


| 本 书 讨 论 的 4 种 平台 都 支持 匿名 存储 映射 设施 。 但 是 注意 ，Linux 为 此 设备 定义 了 MAP. 
ANONYMOUS 标志 ， 并 和 将 MAP ANON 标志 定义 为 与 它 相 同 的 值 以 改善 应 用 的 可 移植 性 。 


为 使 图 15-33 中 的 程序 应 用 这 个 设施 ， 我 们 对 它 做 了 3 处 修改 : (a) 删除 了 /dev/zero 的 
open 语句 ，(b) 删除 了 应 的 close #4), (c) 将 mmap 调用 修改 如 下 : 


if ((area = mmap(0, SIZE, PROT READ | PROT WRITE, 
MAP ANON | MAP SHARED, -1, 0)) == MAP FAILED) 


此 调用 指定 了 MAP ANON 标志 ， 并 将 文件 描述 符 设 置 为 1。 图 15-33 中 的 程序 的 其 余部 分 没 变 。 

最 后 两 个 实例 说 明了 在 多 个 无 关 进 程 之 间 如 何 使 用 共享 存储 段 。 如 果 在 两 个 无 关 进 程 之 间 要 
使 用 共享 存储 段 ， 那 么 有 两 种 替代 的 方法 。 一 种 是 应 用 程序 使 用 XSI 共享 存储 函数 ， 男 一 种 是 使 
用 mmap 将 同一 文件 映射 至 它们 的 地 址 空间 ， 为 此 使 用 MAP_SHARED 标志 。 


15.10 POSIX 信号 量 


POSIX 信号 量 机 制 是 3 种 IPC 机 制 之 一 , 3 种 IPC 机 制 源 于 POSIX.1 的 实时 扩展 。 Single UNIX 
Specification 将 3 种 机 制 (消息 队列 、 信号 量 和 共享 存储 ) 置 于 可 选 部 分 中 。 在 SUSv4 之 前 , POSIX 
信号 量 接 口 已 经 被 包含 在 信号 量 选 项 中 。 在 SUSv4 中 ， 这 些 接口 被 移 至 了 基本 规范 ， 而 消息 队列 
和 共享 存储 接口 依然 是 可 选 的 。 

POSIX 信号 量 接口 意 在 解决 XSI 信和 号 量 接口 的 儿 个 缺陷 。 

e 相 比 于 XSI 接口 ，POSIX 信和 号 量 接口 考虑 到 了 更 高 性 能 的 实现 。 

e POSIX 信和 号 量 接口 使 用 更 简单 ， 没 有 信和 号 量 集 ， 在 熟悉 的 文件 系统 操作 后 一 些 接口 被 模 

式 化 了 。 尽 管 没 有 要 求 一 定 要 在 文件 系统 中 实现 ， 但 是 一 些 系统 的 确 是 这 么 实现 的 。 
e POSIX 信和 号 量 在 删除 时 表现 更 完美 。 回 忆 一 下 ， 当 一 个 XSI 信和 号 量 被 删除 时 ， 使 用 这 个 
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信号 量 标识 符 的 操作 会 失败 ， 并 将 errno 设置 成 EIDRM。 使 用 POSIX 信号 量 时 ， 操 作 
能 继续 正常 工作 直到 该 信号 量 的 最 后 一 次 引用 被 释放 。 
POSIX 信号 量 有 两 种 形式 :命名 的 和 未 命名 的 。 它 们 的 差异 在 于 创建 和 销毁 的 形式 上 ， 但 其 
他 工作 一 样 。 未 命名 信号 量 只 存在 于 内 存 中 ， 并 要 求 能 使 用 信号 量 的 进程 必须 可 以 访问 内 存 。 这 
意味 着 它们 只 能 应 用 在 同一 进程 中 的 线程 ， 或 者 不 同 进程 中 已 经 映射 相同 内 存 内 容 到 它们 的 地 址 
空间 中 的 线程 。 相 反 ， 命 名 信号 量 可 以 通过 名 字 访 问 ， 因 此 可 以 被 任何 已 知 它们 名 字 的 进程 中 的 
线程 使 用 。 
我 们 可 以 调用 sem open 函数 来 创建 一 个 新 的 命名 信号 量 或 者 使 用 一 个 现 有 信和 号 量 。 


#include <semaphore.h> 


sem t *sem open(const char *name, int oflag, ... /* mode t mode, 
unsigned int value */ ); 





BE: 若 成 功 ， 返 回 指向 信号 量 的 指针 ， 若 出 错 ， 返 回 SEM FAILED 


当 使 用 一 个 更 有 的 命名 信号 量 时 ， 我 们 仅仅 指定 两 个 参数 ， 信 和 号 量 的 名 字 和 oflag 参数 的 0 
值 。 当 这 个 oflag 参数 有 0_CREAT 标志 集 时 ， 如 果 命名 信和 号 量 不 存在 ， 则 创建 一 个 新 的 。 如 果 它 
已 经 存在 ， 则 会 被 使 用 ， 但 是 不 会 有 额外 的 初始 化 发 生 。 

当 我 们 指定 O_CREAT 标志 时 , 需要 提供 两 个 额外 的 参数 。 mode 参数 指定 谁 可 以 访问 信号 量 。 
mode 的 取 值 和 打开 文件 的 权限 位 相同 : 用 户 读 、 用 户 写 、 用 户 执行 、 组 读 、 组 写 、 组 执行 、 其 他 

读 、 其 他 号 和 其 他 执行 。 赋 值 给 信号 量 的 权限 可 以 被 调用 者 的 文件 创建 屏蔽 字 修 改 〈 见 4.5 节 和 
4.8 节 )。 注 意 ， 只 有 读 和 写 访 问 要 紧 ， 但 是 当 我 们 打开 一 个 现 有 信和 号 量 时 接口 不 允许 指定 模式 。 
实现 经 常 为 读 和 写 打 开 信 号 量 。 
在 创建 信号 量 时 , value 参数 用 来 指定 信号 量 的 初始 值 。 它 的 取 值 是 0 一 SEM_VALUE_MAX( 见 图 2-9)。 
如 果 我 们 想 确 保 创 建 的 是 信号 量 ， 可 以 设置 offasg 参数 为 0_CREAT10_EXCcL。 如 果 信 和 号 量 已 
经 存在 ， 会 导致 sem_open KK. 
为 了 增加 可 移植 性 ， 在 选择 信号 量 命名 时 必须 遵循 一 定 的 规则 。 
© 名 字 的 第 一 个 字符 应 该 为 斜 杠 (/)。 尽 管 没 有 要 求 POSIX 信号 量 的 实现 要 使 用 文件 系统 ， 
但 是 如 果 使 用 了 文件 系统 ， 我 们 就 要 在 名 字 被 解释 时 消除 二 义 性 。 

© 名 字 不 应 包含 其 他 斜 杠 以 此 避免 实现 定义 的 行为 。 例 如 ， 如 果 文 件 系统 被 使 用 了 了， 那么 
名 字 /mysem 和 / /mysem 会 被 认定 为 是 同一 个 文件 名 , 但 是 如 果实 现 没 有 使 用 文件 系统 ， 
那么 这 两 种 命名 可 以 被 认为 是 不 同 的 〈 考 虑 下 如 果实 现 把 名 字 哈 希 运算 转换 成 一 个 用 来 
识别 信号 量 的 整数 值 会 发 生 什么 )。 

e 信和 号 量 名 字 的 最 大 长 度 是 实现 定义 的 。 名 字 不 应 该 长 于 _POSIX_NAME_MAX〔 见 图 2-8) 

个 字符 长 度 。 因 为 这 是 使 用 文件 系统 的 实现 能 允许 的 最 大 名 字 长 度 的 限制 。 

如 果 想 在 信号 量 上 进行 操作 ，sem_open 函数 会 为 我 们 返回 一 个 信和 号 量 指针 ， 用 于 传递 到 其 他 

信号 量 函数 上 。 当 完成 信号 量 操作 时 ， 可 以 调用 sem close 函数 来 释放 任何 信号 量 相 关 的 资源 。 


#include <semaphore.h> 


int sem_close(sem_t *sem); 





如 果 进 程 没有 首先 调用 sem close 而 退出 ， 那 么 内 核 将 自动 关闭 任何 打开 的 信号 量 。 注 意 ， 这 不 ， 
会 影响 信号 量 值 的 状态 一 一 如 果 已 经 对 它 进 行 了 增 1 操作 ， 这 并 不 会 仅 因 为 退出 而 改变 。 类似 地 ,如果 
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调用 sem_close， 信 和 号 量 值 也 不 会 受到 影响 。 在 XSI 信号 量 中 没有 类 似 SEM UNDO 标志 的 机 制 。 
可 以 使 用 sem unlink 函数 来 销毁 一 个 命名 信和 号 量 。 


#include «semaphore.h» 






int sem unlink(const char *name); 
返回 值 ， 着 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
sem unlink 畏 数 删 除 信号 量 的 名 字 。 如 果 没 有 打开 的 信号 量 引 用 ， 则 该 信号 量 会 被 销毁 。 
否则 ， 销 毁 将 延迟 到 最 后 一 个 打开 的 引用 关闭 。 
不 像 XSI 信号 量 ， 我 们 只 能 通过 一 个 函数 调用 来 调节 POSIX 信和 号 量 的 值 。 计 数 减 1 和 对 一 
个 二 进 制 信号 量 加 锁 或 者 获取 计数 信号 量 的 相关 资源 是 相 类 似 的 。 
| 注意 ， 信 和 号 量 和 POSIX 信号 本 之 间 是 没有 差别 的 。 是 采用 二 进 制 信号 量 还 是 用 计数 信号 量 取 
决 于 如 何 初始 化 和 使 用 信号 量 。 如 果 一 个 信号 量 只 是 有 值 0 或 者 1， 那 么 它 就 是 二 进 制 信号 量 。 
| 当 二 进 制 信号 量 是 ] 时 ， 它 就 是 “解锁 的 "， 如 果 它 的 值 是 0， 那 就 是 “加 锁 的 ”。 


可 以 使 用 sem wait 或 者 sem trywait 函数 来 实现 信号 量 的 减 1 操作 。 


#include <semaphore.h> 


int sem trywait(sem t *sem); 


int sem wait (sem t *sem); 





使 用 sem wait 函数 时 ， 如 果 信 号 量 计数 是 0 就 会 发 生 阻 塞 。 直 到 成 功 使 信号 量 减 1 或 者 被 
信号 中 断 时 才 返 回 。 可 以 使 用 sem trywait 函数 来 避免 阻塞 。 调 用 sem trywait 时 ， 如 果 信 
号 量 是 0， 则 不 会 阻塞 ， 而 是 会 返回 -1 并 且 将 errno HA EAGAIN. 

第 三 个 选择 是 阻塞 一 段 确定 的 时 间 。 为 此 ， 可 以 使 用 sem timewait 函数 。 

#include <semaphore.h> 
#include <time.h> 


int sem_timedwait(sem_t *restrict sem, 
const struct timespec *restrict tsptr); 


返回 值 : 若 成 功 ， 返 回 0; 车 出 错 ， 返 回 一 1 
想 要 放弃 等 待 信号 量 的 时 候 , 可 以 用 xp 参数 指定 绝对 时 间 。 超 时 是 基于 CLOCK | REALTIME 
时 钟 的 (回忆 图 6-8)。 如 果 信 号 量 可 以 立即 减 1， 那 么 超时 值 就 不 重要 了 ， 尽 管 指定 的 可 能 是 过 
去 的 某 个 时 间 ， 信 和 号 量 的 减 1 操作 依然 会 成 功 。 如 果 超 时 到 期 并 且 信 号 量 计 数 没 能 减 1， 
sem timedwait 将 返回 -1 且 将 errno 设置 为 ETIMEDOUT。 
可 以 调用 sem post 函数 使 信号 量 值 增 1。 这 和 解锁 一 个 二 进 制 信号 量 或 者 释放 一 个 计数 信 
号 量 相关 的 资源 的 过 程 是 类 似 的 。 


#include <semaphore.h> 





int sem post(sem t *sem); 





调用 sem post 时 ， 如 果 在 调用 sem wait (或 者 sem timedwaitO 中 发 生 进 程 阻塞 ， 那 么 进 
程 会 被 唤醒 并 且 被 sem post 141 的 信和 号 量 计 数 会 再 次 被 sem_wait (或 者 sem timedwait) M1. 
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当 我 们 想 在 单个 进程 中 使 用 POSIX 信号 量 时 , 使 用 未 命名 信和 号 量 更 容易 。 这 仅仅 改变 创建 和 
销毁 信号 量 的 方式 。 可 以 调用 sem init 函数 来 创建 一 个 未 命名 的 信号 量 。 


#include <semaphore.h> 


int sem init(sem t *sem, int pshared, unsigned int value); 


返回 值 : 者 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 





pshared 参数 表明 是 否 在 多 个 进程 中 使 用 信号 量 。 如 果 是 ， 将 其 设置 成 一 个 非 0 fH. value 参 
数 指定 了 信号 量 的 初始 值 。 

需要 声明 一 个 sem t 类 型 的 变量 并 把 它 的 地 址 传递 给 sem init 来 实现 初始 化 ， 而 不 是 像 sem_ 
open 函数 那样 返回 一 个 指向 信号 量 的 指针 。 如 果 要 在 两 个 进程 之 间 使 用 信号 量 ， 需 要 确保 sem 
参数 指向 两 个 进程 之 间 共 享 的 内 存 范围 。 

对 未 命名 信和 号 量 的 使 用 已 经 完成 时 ， 可 以 调用 sem destroy 函数 丢弃 它 。 


#include <semaphore.h> 


int sem_destroy(sem_t *sem); 





调用 sem destroy 后 , 不 能 再 使 用 任何 带 有 sem — 除非 通过 调用 sem init 
重新 初始 化 它 。 
sem getvalue 畏 数 可 以 用 来 检索 信号 量 值 。 


#include <semaphore.h> 


int sem getvalue(sem t *restrict sem, int *restrict valp); 


返回 值 ， 若 成 功 ， 返回 0: Sune, 返回 -1 





成 功 后 ，valp 指向 的 整数 值 将 包含 信号 量 值 。 但 是 请 注意 ， 我 们 试图 要 使 用 我 们 刚 读 出 来 的 
值 的 时 候 ， 信 号 量 的 值 可 能 已 经 变 了 。 除 非 使 用 额外 的 同步 机 制 来 避免 这 种 竞争 ， 否 则 sem 
getvalue 函数 只 能 用 于 调试 。 


| Mac OS X 10.6.8 不 支持 sem getvalue BA, 


Bm 实例 

介绍 POSIX 接口 的 动机 之 一 就 是 ， 通 过 设计 ， 它 们 的 性 能 要 明显 好 于 现 有 XS 信和 号 量 接口 。 
下 面 将 了 解 现 有 系统 是 否 达 到 了 这 个 目标 ， 尽 管 这 些 系统 没有 设计 支持 实时 的 应 用 。 

在 图 15-34 中 ， 让 3 个 进程 在 两 种 平台 (Linux 3.2.0 和 Solaris 10) 上 竞争 分 配 和 释放 信和 号 量 
1 000 000 次 ， 比 较 了 分 别 使 用 XSI 信号 量 (不 带 SEM_UNDO) Al POSIX 信号 量 时 的 性 能 。 


ET 


XSI Xs HER | 11.85 27.91 5.93 7.33 
POSIX 信号 量 13.72 24.44 0.75 0.41 
1 15-34 ”信号 量 实现 的 时 间 比 较 


在 图 15-34 中 可 以 看 到 ， 在 Solaris 系统 中 ，POSIX 信号 量 相对 于 XSI 信号 量 在 时 间 上 仅 提 高 了 
12%， 但 是 在 Linux 系统 中 却 提高 了 94% Gir 18 倍 的 速度 )。 如 果 跟 踪 程 序 ， 我 们 会 发 现 ，POSIX 信和 号 
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量 的 Linux 实现 将 文件 映射 到 了 进程 地 址 空间 中 ， 并 且 没有 使 用 系统 调用 来 操作 各 自 的 信号 量 。 uw" 


Ba 实例 

回忆 图 12-5, Single UNIX Specification 并 没 用 定义 当 一 个 线程 对 一 个 普通 互 斥 量 加 锁 ， 而 
另 一 个 线程 试图 去 解锁 它 的 情况 ， 但 是 这 种 情况 下 错误 检查 互 斥 量 和 递归 互 斥 量 会 产生 错误 。 
为 二 进 制 信号 量 可 以 像 互 斥 量 一 样 来 使 用 ， 我 们 可 以 使 用 信号 量 来 创建 自己 的 锁 原 语 从 而 提 
供 互 斥 。 

假设 我 们 将 要 创建 自己 的 锁 ， 这 种 锁 能 被 一 个 线程 加 锁 而 被 另 一 线程 解锁 ， 那 么 它 的 结构 可 
能 是 这 样 的 : 

struct slock 1 


sem t *semp; 
char name[ POSIX NAME MAX]; 


) 
图 15-35 中 的 程序 展示 了 基于 信号 量 的 互 斥 原 语 的 实现 。 


#include "slock.h" 
#include <stdlib.h> 
#include <stdio.h> 
#include <unistd.h> 
#include <errno.h> 


struct slock * 
s_alloc() 
( 
struct slock *sp; 
static int cnt; 


if ((sp = malloc(sizeof(struct slock))) -- NULL) 
return (NULL); 
do { 
snprintf(sp-»name, sizeof(sp-»name), "/%ld.%d", (long)getpid(), 
cnt++); 


sp->semp = sem open(sp-»name, O CREAT|O EXCL, S IRWXU, 1); 
} while ((sp->semp == SEM FAILED) && (errno == EEXIST)); 
if (sp->semp == SEM FAILED) { 
free(sp); 
return (NULL); 
} 
sem_unlink (sp->name) ; 
return (sp); 
} 


void 
s free(struct slock *sp) 
{ 
sem close(sp-»semp); 
free (sp); 
} 


int 
s_lock(struct slock *sp) 
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{ 
return (sem_wait (sp->semp) ); 


} 


int 
s_trylock(struct slock *sp) 
{ 
return (sem trywait (sp->semp) ) ; 
} 


int 
s_unlock {struct slock *sp) 
{ 
return (sem_post (sp->semp) ); 
} 


15-35 ”使 用 POSIX 信号 量 的 互 斥 
根据 进程 ID 和 计数 器 来 创建 名 字 。 我 们 不 会 刻意 用 互 斥 量 去 保护 计数 器 ， 因 为 当 两 个 竞争 
的 线程 同时 调用 s alloc 并 以 同一 个 名 字 结 束 时 ， 在 调用 sem open 中 使 用 o ExCL 标志 将 会 
使 其 中 一 个 线程 成 功 而 另 一 个 线程 失败 ， 失 败 的 线程 会 将 errno 设置 成 EEXIST， 所 以 对 于 这 种 
情况 ， 我 们 只 是 再 次 尝试 。 注 意 ， 我 们 打开 一 个 信号 量 后 断 开 了 它 的 连接 。 这 销毁 了 名 字 ， 所 以 
[584] 导致 其 他 进程 不 能 再 次 访问 它 ， 这 也 简化 了 进程 结束 时 的 清理 工作 。 a 


15.11 客户 进程 -服务 器 进程 属性 


下 面 详细 说 明 客 户 进程 和 服务 器 进程 的 某 些 属性 ， 这 些 属 性 受到 它们 之 间 所 使 用 的 各 种 IPC 
类 型 的 影响 。 最 简单 的 关系 类 型 是 使 客户 进程 fork 然后 exec 所 希望 的 服务 器 进程 。 在 fork 
之 前 先 创 建 两 个 半 双 工 管道 使 数据 可 在 两 个 方向 传输 。 图 15-16 是 这 种 安排 的 一 个 例子 。 所 执行 
的 服务 器 进程 可 能 是 一 个 设置 用 户 ID 的 程序 ， 这 使 它 具 有 了 特权 。 另 外 ， 服 务 器 进程 查看 客户 
进程 的 实际 用 户 ID 就 可 以 决定 客户 进程 的 真实 身份 。( 回 忆 8.10 节 ， 从 中 可 了 解 到 在 exec 前 后 
实际 用 户 ID 和 实际 组 ID 并 没有 改变 .) 

在 这 种 安排 下 ， 可 以 构建 一 个 open 服务 器 进程 (open server). (17.5 节 提 供 了 这 种 客户 进程 - 
服务 器 进程 机 制 的 一 种 实现 。) 它 为 客户 进程 打开 文件 而 不 是 客户 进程 自己 调用 open HM. 这样 
就 可 以 在 正常 的 UNIX 用 户 权 限 、 组 权限 以 及 其 他 权限 之 上 或 之 外 ， 增 加 附加 的 权限 检查 。 假 定 
服务 器 进程 执行 的 是 设置 用 户 ID 程序 ， 这 给 予 了 它 附加 的 权限 (很 可 能 是 root 权限 )。 服 务 器 进 
程 用 客户 进程 的 实际 用 户 ID 来 决定 是 否 给 予 它 对 所 请 求 文件 的 访问 权限 。 使 用 这 种 方式 ， 可 以 
构建 一 个 服务 器 进程 ， 它 允许 某 些 用 户 获 得 通常 没有 的 访问 权限 。 

在 此 例子 中 ， 因 为 服务 器 进程 是 父 进程 的 子 进程 ， 所 以 它 所 能 做 的 就 是 将 文件 内 容 传 送 给 父 
进程 。 尽 管 这 种 方式 对 普通 文件 工作 得 很 好 ， 但 是 对 有 些 文件 却 不 能 工作 ， 如 特殊 设备 文件 。 我 
们 希望 能 做 的 是 使 服务 器 进程 打开 所 要 求 的 文件 ， 并 传 回 文件 描述 符 。 但 是 实际 情况 却 是 父 进 程 
可 向 子 进程 传送 打开 文件 描述 符 ， 而 子 进程 却 不 能 向 父 进程 传 回 文件 描述 符 〈 除 非 使 用 专门 的 编 
程 技术 ， 这 将 在 第 17 章 介绍 )。 

15-23 中 展示 了 另 一 种 类 型 的 服务 器 进程 。 这 种 服务 器 进程 是 一 个 守护 进程 ， 所 有 客户 进 
程 用 某 种 形式 的 IPC 与 其 联系 。 对 于 这 种 形式 的 客户 进程 -服务 器 进程 关系 ， 不 能 使 用 管道 。 需 
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要 使 用 一 种 形式 的 命名 IPC， 如 FIFO 或 消息 队列 。 使 用 FIFO 时 ， 如 果 服 务 器 进程 必需 将 数据 送 
回 客户 进程 ， 则 对 每 个 客户 进程 都 要 有 单独 使 用 的 FIFO。 如 果 客 户 进程 -服务 器 进程 应 用 程序 只 
有 客户 进程 向 服务 器 进程 发 送 数据 ， 则 只 需要 一 个 众所周知 的 FIFO。(System V 行 式 打印 机 假 脱 
机 程序 使 用 这 种 形式 的 客户 进程 -服务 器 进程 。 客 户 进程 是 1p(1) 命 令 ， 服 务 器 进程 是 1psched 
守护 进程 。 因为 只 有 从 客户 进程 到 服务 器 进程 的 数据 流 ， 所 有 只 需 使 用 一 个 FIFO。 没 有 需要 送 回 
客户 进程 的 数据 。) 

使 用 消息 队列 则 存在 多 种 可 能 性 。 

C1) 在 服务 器 进程 和 所 有 客户 进程 之 间 只 使 用 一 个 队列 ， 使 用 每 个 消息 的 类 型 字段 指明 谁 是 
消息 的 接受 者 。 例 如 ， 客 户 进程 可 以 用 设置 为 1 的 类 型 字段 来 发 送 它们 的 消息 。 在 请 求 之 中 应 包 
括 客户 进程 的 进程 ID。 此 后 ， 服 务 器 进程 在 发 送 响应 消息 时 ， 将 类 型 字段 设置 为 客户 进程 的 进程 
D. 服务 器 进程 只 接受 类 型 字段 为 1 的 消息 (msgrcv 的 第 4 个 参数 )， 客 户 进程 则 只 接受 类 型 字 
段 等 于 它们 进程 ID 的 消息 。 

(2) 另 一 种 方法 是 每 个 客户 进程 使 用 一 个 单独 的 消息 队列 。 在 向 服务 器 进程 发 送 第 一 个 请 求 
之 前 ， 每 个 客户 进程 先 使 用 键 TPC_PRIVATE 创建 它 自 己 的 消息 队列 。 服 务 器 进程 也 有 它 自 己 的 
队列 ， 其 键 或 标识 符 是 所 有 客户 进程 都 知道 的 。 客 户 进程 将 其 第 一 个 请 求 发 送 到 服务 器 进程 的 众 
所 周知 的 队列 上 ， 该 请 求 中 应 包含 其 客户 进程 消息 队列 的 队列 ID. 服务 器 进程 将 其 第 一 个 响应 发 
送 到 此 客户 进程 队列 ， 此 后 的 所 有 请 求 和 响应 都 在 此 队列 上 交换 。 

使 用 消息 队列 的 这 两 种 技术 都 可 以 用 共享 内 存 段 和 同步 方法 〈 信 和 号 量 或 记录 锁 ) 来 实现 。 

使 用 这 种 类 型 的 客户 进程 -服务 器 进程 关系 《客户 进程 和 服务 器 进程 是 无 关 进 程 ) 的 问题 是 
服务 器 进程 如 何 准确 地 标识 客户 进程 。 除 非 服务 器 进程 正在 执行 一 种 非特 权 操 作 ， 否 则 服务 器 进 
程 知道 客户 进程 的 身份 是 很 重要 的 。 例 如 ， 若 服务 器 进程 是 一 个 设置 用 户 ID 程序 ， 就 有 这 种 要 
R. 虽然 所 有 这 几 种 形式 的 IPC 都 经 由 内 核 , 但 是 它们 并 未 提供 任何 设施 使 内 核能 够 标识 发 送 者 。 

对 于 消息 队列 ， 如 果 在 客户 进程 和 服务 器 进程 之 间 使 用 一 个 专用 队列 (于 是 一 次 只 有 一 个 消 
息 在 该 队列 上 )， 那 么 队列 的 msg_ispid 包含 了 对 方 进程 的 进程 ID。 但 是 当 客 户 进程 将 请 求 发 
送 给 服务 器 进程 时 ， 我 们 想 要 的 是 客户 进程 的 有 效用 户 ID， 而 不 是 它 的 进程 ID。 现 在 还 没有 一 
种 可 移植 的 方法 , 在 已 知 进程 ID 情况 下 可 以 得 到 有 效用 户 ID。( 自然 地 ， 内 核 在 进程 表 项 中 保持 
有 这 两 种 值 ， 但 是 除非 彻底 检查 内 核 存储 空间 ， 和 否则 已 知 一 个 ， 无 法 得 到 另 一 个 。) 

我 们 将 在 17.2 节 中 使 用 下 列 技术 ， 使 服务 器 进程 可 以 标识 客户 进程 。 这 一 技术 可 使 用 FIFO、 
消息 队列 、 信 号 量 以 及 共享 存储 。 在 下 面 的 说 明 中 假定 按 图 15-23 使 用 了 FIFO. 客户 进程 必须 创建 
它 自己 的 FIFO， 并 且 设 置 该 FIFO 的 文件 访问 权限 ， 使 得 只 允许 用 户 读 和 用 户 写 。 假 定 服务 器 进程 
具有 超级 用 户 特权 或 者 它 很 可 能 并 不 关心 客户 进程 的 真实 标识 )， 那 么 服务 器 进程 仍 可 读 、 写 此 
FIFO。 当 服务 器 进程 在 众所周知 的 FFO 上 接收 到 客户 进程 的 第 一 个 请 求 时 〔 它 应 当 包 含 客户 进程 
专用 FIFO 的 标识 )， 服 务 器 进程 调用 针对 客户 进程 专用 FIFO 的 stat 或 fstat。 服 务 器 进程 假设 : 
客户 进程 的 有 效用 户 ID 是 FIFO 的 所 有 者 (stat 结构 的 st uid 字段 )。 服 务 器 进程 验证 该 FIFO 

只 有 用 户 读 和 用 户 写 权 限 。 服 务 器 进程 还 应 检查 与 该 FIFO 有 关 的 3 个 时 间 量 (stat 结构 的 st_ 
atime. st mtime 和 st_ctime 字段 )， 要 检查 它们 与 当前 时 间 是 否 很 接近 《如 不 早 于 当前 时 间 
15 秒 或 30 秒 )。 如 果 一 个 恶意 客户 进程 可 以 创建 一 个 FIFO， 使 男 一 个 用 户 成 为 其 所 有 者 ， 并 且 设 
置 该 文件 的 权限 位 为 用 户 读 和 用 户 写 ， 那 么 在 系统 中 就 存在 了 其 他 基础 性 的 安全 问题 。 

为 了 用 XSI IPC 实现 这 种 技术 ， 回 想 一 下 与 每 个 消息 队列 、 信 号 量 以 及 共享 存储 段 相 关 的 ipc_ 
perm 结构 ， 它 标识 了 IPC 结构 的 创建 者 (cuid 和 cgid 字段 )。 和 使 用 FIFO 的 实例 一 样 ， 服 务 


472 第 15 章 进程 间 通信 


器 进程 应 当 要 求 客户 进程 创建 该 IPC 结构 , 并 使 客户 进程 将 访问 权 设置 为 只 允许 用 户 读 和 用 户 写 。 
服务 器 进程 也 应 检验 与 该 IPC 相关 的 时 间 值 与 当前 时 间 是 否 很 接近 《因为 这 些 IPC 结构 在 显 式 地 
删除 之 前 一 直 存 在 )。 

在 17.3 节 中 , 将 会 看 到 进行 这 种 身份 验证 的 一 种 更 好 的 方法 ， 就 是 内 核 提 供 客户 进程 的 有 效 
FAP ID 和 有 效 组 一 。 套 接 字 子 系统 在 两 个 进程 之 间 传 送 文 件 描述 符 时 可 以 做 到 这 一 点 。 


15.12 小 结 


本 章 详细 说 明了 进程 间 通 信 的 多 种 形式 : 管道 、 命 名 管道 (FIFO). HRA XSI IPC 的 3 
种 形式 的 IPC〔〈 消 息 队 列 、 信 和 号 量 和 共享 存储 )， 以 及 POSIX 提供 的 替代 信和 号 量 机 制 。 信 和 号 量 实 
际 上 是 同步 原 语 而 不 是 IPC， 常 用 于 共享 资源 (如 共享 存储 段 ) 的 同步 访问 。 对 于 管道 ， 我 们 说 
明了 popen 函数 的 实现 、 协 同 进程 以 及 使 用 标准 VO 库 缓冲 机 制 时 可 能 遇 到 的 问题 。 

经 过 分 别 对 消息 队列 与 全 双 工 管道 的 时 间 以 及 信号 量 与 记录 锁 的 时 间 进 行 比较 ， 提 出 了 下 列 
AN: 要 学 会 使 用 管道 和 FIFO， 因 为 这 两 种 基本 技术 仍 可 有 效 地 应 用 于 大 量 的 应 用 程序 。 在 新 的 
应 用 程序 中 ， 要 尽 可 能 避免 使 用 消息 队列 以 及 信和 号 量 ， 而 应 当 考 虑 全 双 工 管道 和 记录 锁 ， 它 们 使 
用 起 来 会 简单 得 多 。 共 享 存储 仍然 有 它 的 用 途 ， 虽 然 通过 mmap 函数 CA 14.8 节 ) 也 能 提供 同样 
的 功能 。 

下 一 章 将 介绍 网 络 PC， 它 们 使 进程 能 够 跨越 计算 机 的 边界 进行 通信 。 


习题 


15.1 在 图 15-6 的 程序 中 ， 在 父 进程 代码 的 末尾 删除 waitpid 前 的 close, SRM? 

15.2 在 图 15-6 的 程序 中 ， 在 父 进程 代码 的 末尾 删除 waitPid， 结 果 将 如 何 ? 

15.3 如 果 popen 函数 的 参数 是 一 个 不 存在 的 命令 ， 会 造成 什么 结果 ? 编写 一 段 小 程序 对 此 进行 
测试 。 

15.4 在 图 15-18 的 程序 中 ， 删 除 信号 处 理 程序 ， 执 行 该 程序 ， 然 后 终止 子 进程 。 输 入 一 行 输入 后 ， 
怎样 才能 说 明 父 进程 是 由 SIGPIPE 终止 的 ? 

15.5 在 图 15-18 的 程序 中 ， 用 标准 VO 库 代 替 进 行 管道 读 、 写 的 read 和 write。 

15.6 POSIX.1 加 入 waitpid 函数 的 理由 之 一 是 ，POSIX.1 之 前 的 大 多 数 系 统 不 能 处 理 下 面 的 
代码 。 


if ( (fp = popen("/bin/true", “r")) == NULL ) 
if ( (rc = system("sleep 100")) -- -1) 


if (pclose(fp) == -1) 


若 在 这 段 代码 中 不 使 用 waitpid 函数 会 如 何 ? 用 wait (VERE? 

15.7 当 一 个 管道 被 写 者 关闭 后 ， 解 释 select 和 poll 是 如 何 处 理 该 管道 的 输入 描述 符 的 。 为 
了 确定 答案 是 否 正确 ， 编 两 个 小 测试 程序 ， 一 个 用 select， 另 一 个 用 poll. 
当 一 个 管道 的 读 端 被 关闭 时 ， 请 重 做 此 习题 以 查看 该 管道 的 输出 描述 符 。 

15.8 如 果 popen 以 type 为 "r" 执 行 cmdstring， 并 将 结果 写 到 标准 错误 输出 ， 结 果 会 如 何 ? 
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15.9 既然 popen MAREE shell 执行 它 的 cemdstring 参数 ， 那 么 cmdstring 终止 时 会 产生 什么 结 
R? 提示， 画 出 与 此 相关 的 所 有 进程 。) 

15.10 POSIX.1 特别 声明 没有 定义 为 读 写 而 打开 FIFO。 虽 然 大 多 数 UNIX 系统 允许 读 写 FIFO, 
但 是 请 用 非 阻塞 方法 实现 为 读 写 而 打开 FIFO. 

15.11 除非 文件 包含 敏感 数据 或 机 密 数 据 ， 否 则 允许 其 他 用 户 读 文件 不 会 造成 损害 。 但 是 ， 如 果 
一 个 恶意 进程 读 取 了 被 一 个 服务 器 进程 和 几 个 客户 进程 使 用 的 消息 队列 中 的 一 条 消息 后 ， 
会 产生 什么 后 果 ? 恶意 进程 需要 知道 哪些 信息 就 可 以 读 消息 队列 ? 

15.12 编写 一 段 程 序 完 成 下 面 的 工作 。 执 行 一 个 循环 $ 次 ， 在 每 次 循环 中 ， 创 建 一 个 消息 队列 ， 
打印 该 队列 的 标识 符 ， 然 后 删除 队列 。 接 着 再 循环 $ 次 ， 在 每 次 循环 中 利用 键 IPC PRIVATE 
创建 消息 队列 ， 并 将 一 条 消息 放 在 队列 中 。 程 序 终止 后 用 ipcs(1) 查 看 消息 队列 。 解 释 队 
列 标识 符 的 变化 。 

15.13 描述 如 何在 共享 存储 段 中 建立 一 个 数据 对 象 的 链接 列表 。 列 表 指 针 如 何 存 储 ? 

15.14 画 出 图 15-33 中 的 程序 运行 时 下 列 值 随 时 间 变 化 的 曲线 图 : 父 进程 和 子 进 程 中 的 变量 i. 
共享 存储 区 中 的 长 整 型 值 以 及 update 函数 的 返回 值 。 假 设 子 进程 在 fork 后 先 运 行 。 

15.15 使 用 15.9 节 中 的 XSI 共享 存储 函数 代替 共享 存储 映射 区 ， 改 写 图 15-33 中 的 程序 。 

15.16 使 用 15.8 节 中 的 XSI 信和 号 量 函 数 改写 图 15-33 中 的 程序 ， 实 现 父 进 程 与 子 进程 间 的 交替 。 

15.17. 使 用 建议 性 记录 锁 改 写 图 15-33 中 的 程序 ， 实 现 父 进程 与 子 进程 间 的 交替 。 

15.18 使 用 15.10 节 中 的 POSIX 信和 号 量 函 数 改 写 图 15-33 中 的 程序 ， 实 现 父 进程 与 子 进 程 间 的 交替 。 
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16.1 引言 


上 一 章 我 们 考察 了 各 种 UNIX 系统 所 提供 的 经 典 进程 间 通 信 机 制 (IPC): 管道 、FIFO、 消 息 
队列 、 信 号 量 以 及 共享 存储 。 这 些 机 制 允 许 在 同一 台 计 算 机 上 运行 的 进程 可 以 相互 通信 。 本 章 将 
考察 不 同 计算 机 (通过 网 络 相 连 ) 上 的 进程 相互 通信 的 机 制 ， 网络 进 程 间 通信 (network IPC). 

在 本 章 中 ， 我 们 将 描述 套 接 字 网 络 进程 问 通 信 接 口 ， 进 程 用 该 接口 能 够 和 其 他 进程 通信 ， 无 
论 它 们 是 在 同一 台 计 算 机 上 还 是 在 不 同 的 计算 机 上 。 实 际 上 ， 这 正 是 套 接 字 接口 的 设计 目标 之 一 : 
同样 的 接口 既 可 以 用 于 计算 机 间 通 信 ， 也 可 以 用 于 计算 机 内 通信 。 尽 管 套 接 字 接口 可 以 采用 许多 
不 同 的 网 络 协议 进行 通信 ， 但 本 章 的 讨论 限制 在 因特网 事实 上 的 通信 标准 : TCP/IP 协议 栈 。 

POSIX.1 中 指定 的 套 接 字 API 是 基于 4.4 BSD 套 接 字 接 口 的 。 尽 管 这 些 年 套 接 字 接口 有 些 细 
微 的 变化 ， 但 是 当前 的 套 接 字 接口 与 20 世纪 80 年 代 早 期 4.2BSD 所 引入 的 接口 很 类 似 。 

本 章 仅 是 一 个 套 接 字 API 的 概述 。Stevens、Fenner 和 Rudoff[2004] 在 有 关 UNIX 系统 网 络 编 

程 的 权威 性 文献 中 详细 讨论 了 套 接 字 接口 。 


16.2 ” 套 接 字 描 述 符 


套 接 字 是 通信 端点 的 抽象 。 正 如 使 用 文件 描述 符 访 问 文 件 ， 应 用 程序 用 套 接 字 描述 符 访 问 套 
接 字 。 套 接 字 描 述 符 在 UNIX 系统 中 被 当 作 是 一 种 文件 描述 符 。 事 实 上 ， 许 多 处 理 文件 描述 符 的 
函数 (il read 和 write) 可 以 用 于 处 理 套 接 字 描 述 符 。 

为 创建 一 个 套 接 字 ， 调 用 socket AR. 





参数 domain CR) 确定 通信 的 特性 ， 包 括 地 址 格式 Ge UR " 16-1 总 结 了 由 
POSIX.1 指定 的 各 个 域 。 各 个 域 都 有 自己 表示 地 址 的 格式 ， 而 表示 各 个 域 的 常数 都 以 AF_ 开 头 ， 
意 指 地 址 族 (address family). 

我 们 将 在 17.2 节 讨 论 UNIX 域 。 大 多 数 系 统 还 定义 了 AF LOCAL 域 , 这 是 AF_UNIX 的 别名 。 
AF UNSPEC 域 可 以 代表 “任何 ” 域 。 历 史上 ， 有 些 平台 支持 其 他 网 络 协 议 ， 如 AF_IPX MRR 
的 NetWare 协议 族 ， 但 这 些 协议 的 域 常数 没有 被 POSIX.1 标准 定义 。 
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AF INET IPv4 因特网 域 


AF INET6 IPv6 因特网 域 
AF UNIX UNIX 域 
AF UPSPEC 未 指定 
16-1 套 接 字 通 信 域 
参数 type 确定 套 接 字 的 类 型 ， 进 一 步 确定 通信 特征 。 图 16-2 总 结 了 由 POSIX.1 定义 的 套 接 
字 类 型 ， 但 在 实现 中 可 以 自由 增加 其 他 类 型 的 支持 。 

















固定 长 度 的 、 无 连接 的 、 不 可 靠 的 报 文 传递 
IP 协议 的 数据 报 接口 (在 POSIX.1 中 为 可 选 ) 
圈定 长 度 的 、 有 序 的 、 可 靠 的 、 面 向 连接 的 报 文 传递 
有 序 的 、 可 靠 的 、 双 向 的 、 面 向 连接 的 字 节 流 
16-2” 套 接 字 类 型 

参数 protocol 通常 是 0， 表 示 为 给 定 的 域 和 套 接 字 类 型 选择 默认 协议 。 当 对 同一 域 和 套 接 字 
类 型 支持 多 个 协议 时 ， 可 以 使 用 protocol 选择 一 个 特定 协议 。 在 AF INET 通信 域 中 ， 套 接 字 类 型 
SOCK STREAM 的 默认 协议 是 传输 控制 协议 (Transmission Control Protocol，TCP)。 在 AF. INET 通信 
域 中 ， 套 接 字 类 型 soCK DGRAM 的 默认 协议 是 UDP。 图 16-3 列 出 了 为 因特网 域 套 接 字 定 义 的 协议 。 








SOCK DGRAM 
SOCK RAW 

SOCK SEQPACKET 
SOCK STREAM 


IPPROTO IP IPv4 网 际 协议 
IPPROTO IPV6 IPv6 网 际 协议 〈 在 POSX.1 中 为 可 选 》 


IPPROTO ICMP 因特网 控制 报 文 协议 (Internet Control Message Protocol) 
IPPROTO_RAW 原始 P 数据 包 协 议 《 在 POSX.1 中 为 可 选 ) 
IPPROTO_TCP 传输 控制 协议 

IPPROTO_UDP 用 户 数据 报 协 议 (User Datagram Protocol? 





图 16-3 ”为 因特网 域 套 接 字 定 义 的 协议 

对 于 数据 报 “SOCK_DGRAM) 接口 ， 两 个 对 等 进程 之 间 通 信 时 不 需要 逻辑 连接 。 只 需要 向 对 
等 进程 所 使 用 的 套 接 字 送出 一 个 报 文 。 

因此 数据 报 提 供 了 一 个 无 连接 的 服务 。 另 一 方面 ， 字 节 流 (SOCK STREAMO 要 求 在 交换 数 
据 之 前 ， 在 本 地 套 接 字 和 通信 的 对 等 进程 的 套 接 字 之 间 建 立 一 个 逻辑 连接 。 

数据 报 是 自 包 含 报 文 。 发 送 数据 报 近似 于 给 某 人 邮寄 信件 。 你 能 邮寄 很 多 信 ， 但 你 不 能 保证 
传递 的 次 序 ， 并 且 可 能 有 些 信件 会 丢失 在 路 上 。 每 封 信件 包含 接收 者 地 址 ， 使 这 封 信件 独立 于 所 
有 其 他 信件 。 每 封 信件 可 能 送 达 不 同 的 接收 者 。 

相反 ， 使 用 面向 连接 的 协议 通信 就 像 与 对 方 打 电 话 。 首 先 ， 需 要 通过 电话 建立 一 个 连接 ， 连 
接 建 立 好 之 后 ， 彼 此 能 双向 地 通信 。 每 个 连接 是 端 到 端的 通信 链 路 。 对 话 中 不 包含 地 址 信息 ， 就 
像 呼 叫 两 端 存 在 一 个 点 对 点 虚拟 连接 ， 并 且 连 接 本 身 暗示 特定 的 源 和 目的 地 。 

SOCK STREAM 套 接 字 提 供 字 节 流 服务 ， 所 以 应 用 程序 分 辨 不 出 报 文 的 界限 。 这 意味 着 从 
SOCK STREAM 套 接 字 读数 据 时 ， 它 也 许 不 会 返回 所 有 由 发 送 进程 所 写 的 字 节 数 。 最 终 可 以 获得 
发 送 过 来 的 所 有 数据 ， 但 也 许 要 通过 若干 次 函数 调用 才能 得 到 。 
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SOCK SEQPACKET 套 接 字 和 SOCK_STREAM 套 接 字 很 类 似 ， 只 是 从 该 套 接 字 得 到 的 是 基于 
报 文 的 服务 而 不 是 字 节 流 服务 。 这 意味 着 从 SOCK_SEQPACKET 套 接 字 接 收 的 数据 量 与 对 方 所 发 
送 的 一 致 。 流 控制 传输 协议 (Stream Control Transmission Protocol, SCTP) 提供 了 因特网 域 上 的 
顺序 数据 包 服 务 。 

SOCK RAW 套 接 字 提 供 一 个 数据 报 接口 ， 用 于 直接 访问 下 面 的 网 络 层 〈 即 因特网 域 中 的 IP 
层 )。 使 用 这 个 接口 时 ， 应 用 程序 负责 构造 自己 的 协议 头 部 ， 这 是 因为 传输 协议 (如 TCP A UDP) 

Ol 被 绕 过 了 。 当 创建 一 个 原始 套 接 字 时 ， 需 要 有 超级 用 户 特权 ， 这 样 可 以 防止 恶意 应 用 程序 绕 过 内 

建安 全 机 制 来 创建 报 文 。 

调用 socket 与 调用 open 相 类 似 。 在 两 种 情况 下 ， 均 可 获得 用 于 VO 的 文件 描述 符 。 当 不 再 需 
要 该 文件 描述 符 时 ， 调 用 close 来 关闭 对 文件 或 套 接 字 的 访问 ， 并 县 放 该 描述 符 以 便 重 新 使 用 。 

虽然 套 接 字 描述 符 本 质 上 是 一 个 文件 描述 符 ， 但 不 是 所 有 参数 为 文件 描述 符 的 函数 都 可 以 接 
受 套 接 字 描 述 符 。 图 16-4 总 结 了 到 目前 为 止 所 讨论 的 大 多 数 以 文件 描述 符 为 参数 的 函数 使 用 套 接 
字 描 述 符 时 的 行为 。 未 指定 和 由 实现 定义 的 行为 通常 意味 着 该 函数 对 套 接 字 描述 符 无 效 。 例 如 ， 
lseek 不 能 以 套 接 字 描述 符 为 参数 ， 因 为 套 接 字 不 支持 文件 偏 移 量 的 概念 。 


close (3.3.5 d$) 释放 套 接 字 

Dup 和 dup2 (Ji 3.12 45) 和 一 般 文件 描述 符 一 样 复制 

fchdir《 见 4.23 节 )》 失败 ， 并 且 将 errno 设置 为 ENOTDIR 

£chomod (H, 4.9 15) 未 指定 

fchown (JL 4.11 47) 由 实现 定义 

fentl (913.14 WW) 支持 一 些 命令 , 包括 F_DUPFD. F_DUPFD_CLOEXEC, F. GETFD. 
F GETFL. F GETOWN. F SETFD. F SETFL 和 F SETOWN 

Fdatasync fl £sync (73.13 Ti) 由 实现 定义 

fstat (1,42 1$) 支持 一 些 stat 结构 成 员 ， 但 如 何 支 持 由 实现 定义 

ftruncate (W 4.13 节 ) 未 指定 

ioctl (4,3.15 节 ) 支持 部 分 命令 ,依赖 于 底层 设备 肾 动 

lseek (44 3.6 4%) 由 实现 定义 “通常 失败 时 会 将 errno 设 为 ESPIPE) 

mmap (A 14.8 $$) 未 指定 

poll ( 见 14.4.2 节 ) 正常 工作 

Pread Ñi pwrite (43.11 节 》 失败 时 会 将 errno WA ESPIPE 

read (913.775) fl readv (X 14.6 $5) 与 没有 任何 标志 位 的 recv (A 16.54) 等 价 

select (H 14.4.1 1) 正常 工作 

write (9.3.8 W) 和 writev (14.6 4) 与 没有 任何 标志 位 的 send (A 16.5 节 ) 等 价 


图 16-4 文件 描述 符 函 数 使 用 套 接 字 时 的 行为 
套 接 字 通信 和 是 双向 的 。 可 以 采用 shutdown 函数 来 禁止 一 个 套 接 字 的 VO. 








如 果 how 是 SHUT_RD (关闭 读 端 )， 那 么 无 法 从 套 接 字 读 取 数 据 。 eae E WR (KAS 

端 )， 那 么 无 法 使 用 套 接 字 发 送 数据 。 如 果 how 是 SHUT_RDWR， 则 既 无 法 读 取 数据 ， 又 无 法 发 送 数 据 。 
能 够 关闭 (close) 一 个 套 接 字 ， 为 何 还 使 用 shutdown BE? 这 里 有 若干 理由 。 首 先 ， 只 有 

最 后 一 个 活动 引用 关闭 时 ，close 才 释 放 网 络 端点 。 这 意味 着 如 果 复 制 -一 个 套 接 字 如 采用 dup), 
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要 直到 关闭 了 最 后 一 个 引用 它 的 文件 描述 符 才 会 释放 这 个 套 接 字 。 而 shutdown 允许 使 一 个 套 接 
字 处 于 不 活动 状态 ， 和 引用 它 的 文件 描述 符 数 目 无 关 。 其 次 ， 有 时 可 以 很 方便 地 关闭 套 接 字 双 向 
传输 中 的 一 个 方向 。 例 如 ， 如 果 想 让 所 通信 的 进程 能 够 确定 数据 传输 何 时 结束 ， 可 以 关闭 该 套 接 
字 的 写 端 ， 然 而 通过 该 套 接 字 读 端 仍 可 以 继续 接收 数据 。 


16.3 Sut 


上 一 节 学 习 了 如 何 创建 和 销毁 一 个 套 接 字 。 在 学 习 用 套 接 字 做 一 些 有 意义 的 事情 之 前 ， 需 要 
知道 如 何 标识 一 个 目标 通信 进程 。 进 程 标识 由 两 部 分 组 成 。 一 部 分 是 计算 机 的 网 络 地 址 ， 它 可 以 
帮助 标识 网 络 上 我 们 想 与 之 通信 的 计算 机 ， 另 一 部 分 是 该 计算 机 上 用 端口 号 表示 的 服务 ， 它 可 以 
帮助 标识 特定 的 进程 。 


16.3.1 SR 


与 同一 台 计 算 机 上 的 进程 进行 通信 时 , 一 般 不 用 考虑 字 节 序 。 字 节 序 是 一 个 处 理 器 架构 特性 ， 
用 于 指示 像 整 数 这 样 的 大 数据 类 型 内 部 的 字 节 如 何 排序 。 图 16-5 显示 了 一 个 32 位 整数 中 的 字 节 
是 如 何 排序 的 。 

如 果 处 理 器 架构 支持 大 端 〈big-endian) 字 节 序 ， 那 么 最 大 
字 节 地 址 出 现在 最 低 有 效 字 节 (Least Significant Byte. LSB) E. 
小 端 (little-endian〉 字 节 序 则 相反 最 低 有 效 字 节 包含 最 小 字 节 
地 址 。 注意 , 不 管 字 节 如 何 排 序 ， 最 高 有 效 字 节 (Most Significant pe 
Byte, MSB) 总 是 在 左边 ， 最 低 有 效 字 节 总 是 在 右边 。 因 此 ， 如 
果 想 给 一 个 32 位 整数 赋值 0x04030201， 不 管 字 节 序 如 何 ， 最 T EN 
高 有 效 字 节 都 将 包含 4, 最 低 有 效 字 节 都 将 包含 1。 如 果 接 下 来 想 MSB LSB 
将 一 个 字符 指针 《cp) 强制 转换 到 这 个 整数 地 址 ， 就 会 看 到 字 节 图 16-5 一 个 32 位 整数 的 字 节 序 
序 带 来 的 不 同 。 在 小 端 字 节 序 的 处 理 器 上 ，cp10] 指向 最 低 有 效 字 节 因 而 包含 1，cp [31] 指向 最 高 
有 效 字 节 因而 包含 4。 相 比较 而 言 ， 在 大 端 字 节 序 的 处 理 器 上 ，cp [0] 指 向 最 高 有 效 字 节 因而 包 
含 4，cp[【3] 指 向 最 低 有 效 字 节 因 而 包含 1。 图 16-6 总 结 了 本 文 所 讨论 的 4 种 平台 的 字 节 序 。 


FreeBSD 8.0 Intel Pentium 








Linux 3.2.0 Intel Core i5 
Mac OS X 10.6.8 Intel Core 2 Duo 
Solaris 10 Sun SPARC 
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| 有 些 处 理 器 可 以 配置 成 大 端 ， 也 可 以 配置 成 小 端 ， 因 而 使 问题 变 得 更 让 人 图 芒 。 


网 络 协议 指定 了 字 节 序 ， 因 此 异 构 计算 机 系统 能 够 交换 协议 信息 而 不 会 被 字 节 序 所 混 消 。 
TCP/IP 协议 栈 使 用 大 端 字 节 序 。 应 用 程序 交换 格式 化 数据 时 ， 字 节 序 问题 就 会 出 现 。 对 于 TCPAP, 
地 址 用 网 络 字 节 序 来 表示 ， 所 以 应 用 程序 有 时 需要 在 处 理 器 的 字 节 序 与 网 络 字 节 序 之 间 转 换 它 
们 。 例 如 ， 以 一 种 易 读 的 形式 打印 一 个 地 址 时 ， 这 种 转换 很 常见 。 

对 于 TCP/IP 应 用 程序 ， 有 4 个 用 来 在 处 理 器 字 节 序 和 网 络 字 节 序 之 间 实 施 转换 的 函数 。 
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#include <arpa/inet.h> 
uint32 t htonl(uint32 t hostint32) ; 

: 以 网 络 字 节 序 表示 的 32 位 整数 
uintl6_t htons(uintl6 t hostintló) ; 


: 以 网 络 字 节 序 表示 的 16 位 整数 
uint32 t ntohl(uint32 t nmetint32) ; 


: 以 主机 字 节 序 表 示 的 32 位 整数 


uintl6 t ntohs(uintl6 t nmetintló); 


; 以 主机 字 节 序 表 示 的 16 位 整数 


h 表示 “主机 ” 字 节 序 ，n 表示 “网 络 ” 字 节 序 。1 表示 “长 ”( 即 4 字 节 ) 整数 ，s 表示 “ 短 ” 
( 即 4 字 节 ) 整数 。 虽 然 在 使 用 这 些 函数 时 包含 的 是 <arpay/inet .h> 头 文件 , 但 系统 实现 经 常 是 
在 其 他 头 文件 中 声明 这 些 函 数 的 ， 只 是 这 些 头 文件 都 包含 在 <arpa/inet .h> 中 。 对 于 系统 来 说 ， 
把 这 些 函 数 实现 为 宏 也 是 很 常见 的 。 


16.3.2 ”地 址 格式 


一 个 地 址 标识 一 个 特定 通信 域 的 套 接 字 端 点 ， 地 址 格式 与 这 个 特定 的 通信 域 相关 。 为 使 不 同 
格式 地 址 能 够 传 入 到 套 接 字 函 数 ， 地 址 会 被 强制 转换 成 一 个 通用 的 地 址 结构 sockaddr: 


struct sockaddr ( 
sa family t sa family; /* address family */ 
char sa data[]; /* variable-length address */ 





H 
套 接 字 实 现 可 以 自由 地 添加 额外 的 成 员 并 且 定 义 sa data 成 员 的 大 小 。 例 如 ， 在 Linux 中 ， 该 
结构 定义 如 下 : 


struct sockaddr { 
sa_family_t sa_family; /* address family */ 
char sa data[14]; /* variable-length address */ 


be 
但 是 在 FreeBSD 中 ， 该 结构 定义 如 下 ; 


struct sockaddr { 


unsigned char sa_len; /* total length */ 
sa family t sa family; /* address family */ 
char sa data[14]; /* variable-length address */ 


E 
因特网 地 址 定义 在 <netinet/in.h> 头 文件 中 。 在 IPv4 因特网 域 (AF_INET) 中 ， 套 接 字 
地 址 用 结构 sockaddr_in 表示 ; 


struct in_addr { 
in_addr_t s_ addr; /* IPv4 address */ 


hi 


struct sockaddr_in { 
sa_family_t sin family;  /* address family */ 
in port t sin port; /* port number */ 
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struct in addr sin addr; /* IPv4 address */ 
}3 
数据 类 型 in port_t 定义 成 uint16 t. 数据 类 型 in addr t SMM uint32 t。 这 些 整数 类 
型 在 <stdint .h> 中 定义 并 指定 了 相应 的 位 数 。 
与 AF_INET 域 相 比较 ，IPv6 因特网 域 (AF_INET6) 套 接 字 地 址 用 结构 sockaddr in6 表示 : 
struct in6 addr { 
uint8 t s6 addr[16]; /* IPv6 address */ 


}; 
struct sockaddr in6 { 


sa family t sin6 family; /* address family */ 

in port t sin6 port; /* port number */ 

uint32 t sin6 flowinfo; /* traffic class and flow info */ 
struct in6 addr sin6 addr; /* IPv6 address*/ 

uint32 t sin6 scope id; /* set of interfaces for scope */ 


H 
这 些 都 是 Single UNIX Specification 要 求 的 定义 。 每 个 实现 可 以 自由 添加 更 多 的 字段 。 例 如 ， 在 
Linux 'P, sockaddr in 定义 如 下 : 


struct sockaddr in 1 


sa family t sin family: /* address family */ 
in port t sin port; /* port number */ 
struct in6 addr sin6 addr; /* IPv4 address */ 
unsigned char sin_zero[B]; /* filler */ 


i 
其 中 成 员 sin zero 为 填充 字段 ， 应 该 全 部 被 置 为 0。 

注意 ， 尽 管 sockaddr_in 与 sockaddr_iné 结构 相差 比较 大 ， 但 它们 均 被 强制 转换 成 
sockaddr 结构 输入 到 套 接 字 例 程 中 。 在 17.2 节 , 将 会 看 到 UNIX 域 套 接 字 地 址 的 结构 与 上 述 两 
个 因特网 域 套 接 字 地 址 格式 的 不 同 。 

有 时 ， 需 要 打印 出 能 被 人 理解 而 不 是 计算 机 所 理解 的 地 址 格式 。BSD 网 络 软件 包含 函数 
inet addr 和 inet_ntoa， 用 于 二 进 制 地 址 格式 与 点 分 十 进 制 字符 表示 (a.b.c.d) 之 间 的 相互 
转换 。 但 是 这 些 函 数 仅 适用 于 IPv4 ti. AAS SAR inet_ntop 和 inet_pton 具有 相似 的 
功能 ， 而 且 同 时 支持 IPv4 地 址 和 IPv6 地 址 。 


#include <arpa/inet.h> 


const char *inet_ntop{int domain, const void *restrict addr, 
char *restrict sir, socklen_t size); 


返回 值 ， 车 成 功 ， 返 回 地 址 字符 串 指针 ; AUR. AE NULL 


int inet pton(int domain, const char * restrict str, 
void *restrict addr); 





返回 值 : 若 成 功 ， 返 回 1; ARAM. IO; Fi, AE- 


函数 inet ntop 将 网 络 字 节 序 的 二 进 制 地 址 转换 成 文本 字符 串 格式 。inet_Pton 将 文本 字 
符 串 格式 转换 成 网 络 字 节 序 的 二 进 制 地 址 。 参 数 domain 仅 支持 两 个 值 : AF_INET 和 AF_INET6。 

对 于 inet ntop. BR size 指定 了 保存 文本 字符 串 的 缓冲 区 (str) 的 大 小 。 两 个 常数 用 于 
简化 工作 : INET ADDRSTRLEN 定义 了 足够 大 的 空间 来 存放 一 个 表示 IPv4 地 址 的 文本 字符 串 ; 
INET6 ADDRSTRLEN 定义 了 足够 大 的 空间 来 存放 一 个 表示 IPv6 地 址 的 文本 字符 串 。 对 于 
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inet pton, 如 果 domain 是 AF. INET, 则 缓冲 区 addr 需要 足够 大 的 空间 来 存放 一 个 32 位 地 址 ， 
如 果 domain 是 AF_INET6， 则 需要 足够 大 的 空间 来 存放 一 个 128 位 地 址 。 


16.3.3 ”地 址 查询 


理想 情况 下 ， 应 用 程序 不 需要 了 解 一 个 套 接 字 地 址 的 内 部 结构 。 如 果 一 个 程序 简单 地 传递 一 
个 类 似 于 sockaddr 结构 的 套 接 字 地 址 ， 并 且 不 依赖 于 任何 协议 相关 的 特性 ， 那 么 可 以 与 提供 相 
同类 型 服务 的 许多 不 同 协议 协作 。 

历史 上 ，BSD 网 络 软件 提供 了 访问 各 种 网 络 配置 信息 的 接口 。6.7 节 简 要 讨论 了 网 络 数据 
文件 和 用 来 访问 这 些 文件 的 函数 。 本 节 将 更 详细 地 讨论 一 些 细节 ， 并 且 引 入 新 的 贡 数 来 查询 寻 
址 信息 。 

这 些 消 数 返 回 的 网 络 配 置信 息 被 存放 在 许多 地 方 。 这 个 信息 可 以 存放 在 静态 文件 (如 
/etc/hosts 和 和 /etc/services) 中 ， 也 可 以 由 名 字 服 务 管理 ， 如 域名 系统 (Domain Name 
System，DNS) 或 者 网 络 信息 服务 (Network Information Service，NIS )。 无 论 这 个 信息 放 在 何 处 ， 
都 可 以 用 同样 的 函数 访问 它 。 

通过 调用 gethostent， 可 以 找到 给 定 计 算 机 系统 的 主机 信息 。 

#include «netdb.h» 


struct hostent *gethostent (void); 


返回 值 : 车 成 功 ， 返 回 指针 ， 若 出 错 ， 有 返回 NULL 


void sethostent (int stayapen); 





void endhostent (void); 


如 果 主 机 数据 库 文件 没有 打开 ，gethostent SIF. BBM gethostent 返回 文件 中 的 下 一 
个 条 目 。 函 数 sethostent 会 打开 文件 ， 如 果 文 件 已 经 被 打开 ， 那 么 将 其 回 绕 。 当 stayopen FRR 
置 成 非 0 值 时 ， 调 用 gethostent 之 后 ， 文 件 将 依然 是 打开 的 。 函 数 endhostent 可 以 关闭 文件 。 
34 gethostent 返回 时 ， 会 得 到 一 个 指向 hostent 结构 的 指针 ， 该 结构 可 能 包含 一 个 静态 
的 数据 缓冲 区 ， 每 次 调用 gethostent， 缓 冲 区 都 会 被 履 盖 。hostent 结构 至 少 包含 以 下 成 员 ， 


struct hostent( 


char *h name; /* name of host */ 
char **h aliases; /* pointer to alternate host name array */ 
int h_addrtype; /* address type */ 
apt h length; /* length in bytes of address */ 
char **h addr list; /* pointer to array of network addresses */ 
}? 
返回 的 地 址 采用 网 络 字 节 序 。 


另外 两 个 函数 gethostbyname 和 gethostbyaddr， 原 来 包含 在 hostent MAF, ME 
则 被 认为 是 过 时 的 。SUSv4 已 经 删除 了 它们 。 马 上 将 会 看 到 它们 的 替代 函数 。 
能 够 采用 一 套 相似 的 接口 来 获得 网 络 名 字 和 网 络 编号 。 


#include «netdb.h» 


struct netent *getnetbyaddr (uint32 t nel, int type); 


struct netent *getnetbyname(const char *name); 
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struct netent *getnetent(void); 


3 个 函数 的 返回 值 ， 若 成 功 ， 返 回 指针 ;车 出 错 ， 返 回 NULL 


void setnetent (int stayopen) ; 


void endnetent (void); 


netent 结构 至 少 包含 以 下 字段 : 


struct netent { 





char *n name; /* network name */ 

char **n aliases; /* alternate network name array pointer */ 
int n_addrtype; /* address type */ 

uint32 t n, net; /* network number */ 


}e 

网 络 编号 按照 网 络 字 节 序 返回 。 地 址 类 型 是 地 址 族 常量 之 一 〈 如 AF INET). 
我 们 可 以 用 以 下 函数 在 协议 名 字 和 协议 编号 之 间 进 行 映射 。 

#include «netdb.h» 

struct protoent *getprotobyname(const char *name); 

struct protoent *getprotobynumber (int proto); 

struct protoent *getprotoent (void): 

3 个 函数 的 返回 值 : 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 


void setprotoent(int stayopen) ; 





void endprotoent (void); 


POSIX.1 定义 的 protoent 结构 至 少 包含 以 下 成 员 : 


struct protoent { 


char  *p name; /* protocol name */ 
char **p aliases; /* pointer to altername protocol name array */ 
int P. proto; /* protocol number */ 


服务 是 由 地 址 的 端口 号 部 分 表示 的 。 每 个 服务 由 一 个 唯一 的 众所周知 的 端口 号 来 支持 。 可 以 
使 用 函数 getservbyname 将 一 个 服务 名 映射 到 一 个 端口 号 ， 使 用 函数 get servbyport 将 一 
个 端口 号 映射 到 一 个 服务 名 ， 使 用 函数 getservent 顺序 扫描 服务 数据 库 。 

#include «netdb.h» 
struct servent *getservbyname (const char *name, const char *proto); 
struct servent *getserbyport(int port, const char *proto); 


struct servent *getservent (void); 


3 个 函数 的 返回 值 ， 若 成 功 ， 返 回 指针 ， 涛 出 错 ， 返 回 NULL 


void setservent(int sfayopen); 





void endservent(void); 


servent 结构 至 少 包含 以 下 成 员 ， 


struct servent{ 
char  J*s name; /* service name */ 
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char **s aliases; /* pointer to alternate service name array */ 
int s port; /* port number */ 
char  *s proto; /* name of protocol */ 


he 


POSIX. 定义 了 若干 新 的 通 数 ， 人 允许 一 个 应 用 程序 将 一 个 主机 名 和 一 个 服务 名 映射 到 一 个 地 
址 ， 或 者 反之 。 这 些 函 数 代替 了 较 老 的 函数 gethostbyname 和 gethostbyaddr. 
getaddrinfo 函数 允许 将 一 个 主机 名 和 一 个 服务 名 映射 到 一 个 地 址 。 


#include <sys/socket.h> 
#include <netdb .h> 


int getaddrinfo(const char *restrict host, 
const char *restrict service, 


const struct addrinfo *restrict hint, 
struct addrinfo **restrict res); 


void freeaddrinfo(struct addrinfo *ai); 


EMH: AR, lO; Sue, IBGE 0 错误 码 





需要 提供 主机 和 名、 服务 名 ， 或 者 两 者 都 提供 。 如 果 仅 仅 提 供 一 个 名 字 ， 另 外 一 个 必须 是 一 个 
空 指针 。 主 机 名 可 以 是 一 个 节点 名 或 点 分 格式 的 主机 地 址 。 
getaddrinfo 函数 返回 一 个 链表 结构 addrinfo。 可 以 用 freeaddrinfo 来 释放 一 个 或 
多 个 这 种 结构 ， 这 取决 于 用 ai next 字段 链接 起 来 的 结构 有 多 少 。 


addrinfo 结构 的 定义 至 少 包含 以 下 成 员 : 


struct addrinfo ( 


int ai flags; /* 
int ai family; £* 
int ai socktype; /* 
int ai protocol; {* 


socklen_t ai_addrlen; /* 
struct sockaddr *ai addr; /* 
char *ai canonname; /* 
struct addrinfo *ai next; /* 


) 


customize behavior */ 

address family */ 

socket type */ 

protocol */ 

length in bytes of address */ 
address */ 

canonical name of host */ 
next in list */ 


可 以 提供 一 个 可 选 的 hint 来 选择 符合 特定 条 件 的 地 址 。hint 是 一 个 用 于 过 滤 地 址 的 模板 ， 包 
füai family. ai_flags. ai_protocol 和 ai_socktype 字段 。 剩 余 的 整数 字段 必须 设置 
为 0， 指针 字段 必须 为 空 。 图 16-7 总 结 了 ai flags 字段 中 的 标志 ， 可 以 用 这 些 标志 来 自 定 义 如 


何 处 理 地 址 和 名 字 。 






AI ADDRCONFIG 查询 配置 的 地 址 类 型 (IPv4 或 IPv6) 
AI ALL 查找 IPv4 和 IPv6 地 址 〔〈 仅 用 于 AZ. VAMAPPEDO 

AI CANONNAME 需要 一 个 规范 的 名 字 ( 与 别名 相对 ) 

AI, NUMERICHOST 以 数字 格式 指定 主机 地 址 ， 不 翻译 

AI NUMERICSERV HR EGRE CERDOS, TÉ 

AI PASSIVE RF Ha Fo Ae 

AI_V4MAPPED 如 没有 找到 IPv6 地 址 ， 返 回 映 射 到 IPv6 格式 的 IPv4 地 址 













16-7 addrinfo 结构 的 标志 


16.3 Fk 483 


如 果 getaddrinfo 失败 ， 不 能 使 用 perror 或 strerror 来 生成 错误 消息 ， 而 是 要 调用 
gai strerror 将 返回 的 错误 码 转 换 成 错误 消息 。 


#include <netdb.h> 


const char *gai_strerror(int error); 





返回 值 : 指向 描述 错误 的 字符 串 的 指针 
getnameinfo 函数 将 一 个 地 址 转换 成 一 个 主机 名 和 一 个 服务 名 。 
#include «sys/socket.h» 
#include <netdb.h> 


int getnameinfo(const struct sockaddr *restrict addr, socklen_t alen, 


char *restrict host, socklen_t hostlen, 
char *restrict service, socklen_t servien, int flags); 


返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 


套 接 字 地 址 (addr) 被 翻译 成 一 个 主机 名 和 一 个 服务 名 。 如 果 host 非 空 ， 则 指向 一 个 长 度 为 
hostlen 字 节 的 缓冲 区 用 于 存放 返回 的 主机 名 。 同样 , 如 果 service EF, 则 指向 一 个 长 度 为 servien 
字 节 的 缓冲 区 用 于 存放 返回 的 主机 名 。 

flags 参数 提供 了 一 些 控制 翻译 的 方式 。 图 16-8 总 结 了 支持 的 标志 。 












服务 基于 数据 报 而 非 基 于 流 
如 果 找 不 到 主机 名 ， 将 其 作为 一 个 错误 对 待 

对 于 本 地 主机 ， 仅 返回 全 限定 域名 的 节点 名 部 分 
返回 主机 地 址 的 数字 形式 ， 而 非 主机 名 
对 于 IPv6， 返 回 范围 ID 的 数字 形式 ， 而 非 名 字 
返回 服务 地 址 的 数字 形式 ( 即 端 口号 )， 而 非 名 字 


图 16-8 getnameinfo 函数 的 标志 


NI. DGRAM 
NI NAMEREOD 

NI NOFODN 

NI NUMERICHOST 
NI NUMERICSCOPE 
NI NUMERICSERV 


















" 实例 
16-9 说 明了 getaddrinfo 函数 的 使 用 方法 。 


#include "apue.h" 

#if defined(SOLARIS) 
#include <netinet/in.h> 
#tendif 

#include <netdb.h> 
#include <arpa/inet.h> 
Tif defined (BSD) 
#include <sys/socket.h> 
#include <netinet/in.h> 
fendif 


void 
print_family(struct addrinfo *aip) 
{ 
printf(" family "); 
switch (aip-»ai family) { 
case AF INET: 
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printf ("inet"); 
break; 
case AF INET6: 
printf ("inet6"); 
break; 
case AF_UNIX: 
printf ("unix"); 
break; 
case AF_UNSPEC: 
printf ("unspecified") ; 


break; 
default: 
printf ("unknown"); 
} 
} 
void 


print_type(struct addrinfo *aip) 
{ 
printf(" type "); 
switch (aip-»ai socktype) ( 
case SOCK STREAM: 
printf ("stream"); 
break; 
case SOCK DGRAM: 
printf ("datagram"); 
break; 
case SOCK SEQPACKET: 
printf ("seqpacket"); 
break; 
case SOCK RAW: 
printf ("raw"); 
break; 
default: 
printf ("unknown ($d)", aip-»ai socktype); 


void 
print, protocol(struct addrinfo *aip) 
{ 
printf(" protocol "); 
switch (aip->ai protocol) 1 
case 0: 
printf ("default"); 
break; 
case IPPROTO TCP: 
príntf("TCP") 
break; 
case IPPROTO_UDP: 
printf ("UDP") 
break; 
case IPPROTO_RAW: 
printf ("raw"); 
break; 


“e 


^ 


default: 
printf("unknown ($d)", aip-»ai protocol); 


void 
print flags(struct addrinfo *aip) 


{ 


int 


printf ("flags"); 
if (aip-»ai flags == 0) { 
printf(" 0"); 
) else ( 
if (aip-»ai flags & AI, PASSIVE) 
printf(" passive"); 
if (aip-»ai flags & AI CANONNAME) 
printf(" canon"); 
if (aip-»ai flags & AI NUMERICHOST) 
printf(" numhost"); 
if (aip-»ai flags & AI NUMERICSERV) 
printf(" numserv"); 
if (aip-»ai flags & AI, VAMAPPED) 
printf(" vámapped"); 
if (aip-»ai flags & AI ALL) 
printf(" all"); 


main(int argc, char *argv[]) 


i 


struct addrinfo *ailist, *aip; 

struct addrinfo hint; 

struct sockaddr in *sinp; 

const char *addr; 

int err; 

char abuf [INET_ADDRSTRLEN] ; 


if (argc != 3) 

err quit("usage: %s nodename service", argv[0]); 
hint.ai flags - AI, CANONNAME; 
hint.ai family - 0; 
hint.ai socktype 
hint.ai protocol = 0 
hint.ai addrlen = 0; 
hint.ai canonname - NULL; 
hint.ai addr - NULL; 
hint.ai next = NULL; 


ui 
e 
^ "s 


if (terr = getaddrinfo(argv[1], argví[2], &hint, &ailist)) !- 0) 
err quit("getaddrinfo error: $s", gai strerror(err)); 
for (aip = ailist; aip != NULL; aip = aip-»ai next) { 


print, flags (aip); 
print family(aip); 
print type(aip):; 
print protocol (aip); 


printf("MnNthost %s", aip->ai_canonname?aip->ai_canonname:"-") ; 
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if (aip-»ai family == AF INET) ( 
sinp = (struct sockaddr in *)aip-»ai addr; 
addr = inet ntop(AF INET, &sinp-»sin addr, abuf, 
INET ADDRSTRLEN); 
printf(" address %s", addr?addr:"unknown"); 
printf(" port %d", ntohs(sinp-»sin port)); 
} 
printf ("\n")}; 
} 
exit (0); 


16-9 打印 主机 和 服务 信息 

这 个 程序 说 明了 getaddrinfo 函数 的 使 用 方法 。 如 果 有 多 个 协议 为 指定 的 主机 提供 给 定 的 服 
Z, 程序 会 打印 出 多 条 信息 。 本 实例 仅 打 印 了 与 IPv4 一 起 工作 的 那些 协议 Cai family X AF INET) 
的 地 址 信息 。 如 果 想 将 输出 限制 在 AF_INET 协议 族 ， 可 以 在 提示 中 设置 ai_family 字段 。 

在 一 个 测试 系统 上 运行 这 个 程序 时 ， 得 到 了 以 下 输出 : 

$ ./a.out harry nfs 

flags canon family inet type stream protocol TCP 

host harry address 192.168.1.99 port 2049 


flags canon family inet type datagram protocol UDP - 
host harry address 192.168.1.99 port 2049 T 


16.3.4 ”将 套 接 字 与 地 址 关联 


将 一 个 客户 端的 套 接 字 关 联 上 一 个 地 址 没有 多 少 新 意 , 可 以 让 系统 选 一 个 默认 的 地 址 。 然 而 ， 
对 于 服务 器 ， 需 要 给 一 个 接收 客户 端 请 求 的 服务 器 套 接 字 关 联 上 一 个 众所周知 的 地 址 。 客 户 端 应 
有 一 种 方法 来 发 现 连接 服务 器 所 需要 的 地 址 ， 最 简单 的 方法 就 是 服务 器 保留 一 个 地 址 并 且 注 册 在 
/etc/services 或 者 某 个 名 字 服 务 中 。 

使 用 bind 函数 来 关联 地 址 和 套 接 字 。 


#include <sys/socket.h> 


int bind(int sockfd, const struct sockaddr *addr, socklen t len); 


返回 值 : ERY, e o: 者 出 错 ， 返 回 ~1 





对 于 使 用 的 地 址 有 以 下 一 些 限制 。 
。 在 进程 正在 运行 的 计算 机 上 ， 指 定 的 地 址 必须 有 效 ， 不 能 指定 一 个 其 他 机 器 的 地 址 。 
。 地址 必须 和 创建 套 接 字 时 的 地 址 族 所 支持 的 格式 相 匹配 。 

e 地 址 中 的 端口 号 必须 不 小 于 1024， 除 非 该 进程 具有 相应 的 特权 〈 即 超级 用 户 )。 

e 一 般 只 能 将 一 个 套 接 字 端 点 绑 定 到 一 个 给 定 地 址 上 ， 尽 管 有 些 协议 允许 多 重 绑 定 。 

对 于 因特网 域 ， 如 果 指 定 IP 地 址 为 INADDR ANY (<netinet/in.n> 中 定义 的 )， 套 接 字 端 
点 可 以 被 绑 定 到 所 有 的 系统 网 络 接口 上 。 这 意味 着 可 以 接收 这 个 系统 所 安装 的 任何 一 个 网 卡 的 数 
据 包 。 在 下 一 节 中 可 以 看 到 ， 如 果 调 用 connect 或 1isten， 但 没有 将 地 址 绑 定 到 套 接 字 上 ， 
系统 会 选 一 个 地 址 绑 定 到 套 接 字 上 。 

可 以 调用 getsockname 函数 来 发 现 绑 定 到 套 接 字 上 的 地 址 。 
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finclude <sys/socket.h> 


int getsockname(int sockfd, struct sockaddr *restrict addr, 


socklen_t *restrict alenp); 





返回 值 : 若 成 功 ， 返 回 0， 考 出 错 ， 返 回 -1 


调用 getsockname 之 前 ， 将 alep 设置 为 一 个 指向 整数 的 指针 ， 该 整数 指定 缓冲 区 
sockaddr 的 长 度 。 返 回 时 ， 该 整数 会 被 设置 成 返回 地 址 的 大 小 。 如 果 地 址 和 提供 的 缓冲 区 长 
度 不 匹配 ， 地 址 会 被 自动 截断 而 不 报错 。 如 果 当 前 没有 地 址 绑 定 到 该 套 接 字 ， 则 其 结果 是 未 定 
义 的 。 

如 果 套 接 字 已 经 和 对 等 方 连接 ， 可 以 调用 getpeername 函数 来 找到 对 方 的 地 址 。 

#include <sys/socket.h> 


int getpeername (int sockd, struct sockaddr *restrict addr, 
socklen t *restrict alenp); 





返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
除了 返回 对 等 方 的 地 址 ， 函 数 getpeername 和 getsockname 一 样 。 


16.4 ”建立 连接 


如 果 要 处 理 一 个 面向 连接 的 网 络 服务 (SOCK_STREAM 或 SOCK_SEQPRACKET)， 那 么 在 开始 
交换 数据 以 前 ， 需 要 在 请 求 服务 的 进程 套 接 字 〈 客 户 端 ) 和 提供 服务 的 进程 套 接 字 ( 服 务 嚣 ) 之 
间 建 立 一 个 连接 。 使 用 connect 函数 来 建立 连接 。 


#inciude «sys/socket.h» 


int connect (int sockfd, const struct sockaddr *addr, socklen t lem); 





在 connect 中 指定 的 地 址 是 我 们 想 与 之 通信 的 服务 器 地 址 。 如 果 sockfd Spare 
hk, connect 会 给 调用 者 绑 定 一 个 默认 地 址 。 

当 尝 试 连接 服务 器 时 ， 出 于 一 些 原 因 ， 连 接 可 能 会 失败 。 要 想 一 个 连接 请 求 成 功 ， 要 连接 的 
计算 机 必须 是 开启 的 ， 并 且 正 在 运行 ， 服 务 器 必须 绑 定 到 一 个 想 与 之 连接 的 地 址 上 ， 并 且 服 务 器 
的 等 待 连接 队列 要 有 足够 的 空间 〈 后 面 会 有 更 详细 的 介绍 )。 因 些 ， 应 用 程序 必须 能 够 处 理 
connect 返回 的 错误 ， 这 些 错误 可 能 是 由 一 些 瞬 时 条 件 引 起 的 。 


Sa 实例 
16-10 显示 了 一 种 如 何 处 理 瞬 时 connect 错误 的 方法 。 如 果 一 个 服务 器 运行 在 一 个 负载 
很 重 的 系统 上 ， 就 很 有 可 能 发 生 这 些 错误 。 


#include "apue.h" 
#include <sys/socket.h> 


#define MAXSLEEP 128 


int 
connect retry(int sockfd, const struct sockaddr *addr, socklen t alen) 


488 第 16 章 网 络 IPC: SRS 


{ 


int numsec; 


/* 
* Try to connect with exponential backoff. 
*/ 
for (numsec = 1; numsec <= MAXSLEEP; numsec ««- 1) { 
if (connect(sockfd, addr, alen) == 0) { 
/* 
* Connection accepted. 
*/ 
return{0): 
} 
/* 
* Delay before trying again. 
xf 
if (numsec <= MAXSLEEP/2) 
sleep í(numsec); 
} 
return(-1); 


16-10 ZEAK] connect 


这 个 函数 展示 了 指数 补偿 (exponential backoff) 算法 。 如 果 调 用 connect 失败 ， 进 程 会 休 

了 眠 一 小 段 时 间 ， 然 后 进入 下 次 循环 再 次 尝试 ， 每 次 循环 休眠 时 间 会 以 指数 级 增加 ， 直 到 最 大 延迟 
为 2 分 钟 左右 。 

然而 图 16-10 中 的 代码 存在 一 个 问题 : 代码 是 不 可 移植 的 。 EE Linux 和 Solaris 上 可 以 工作 ， 
但 是 在 FreeBSD 和 Mac OS X 上 却 不 能 按 预 期 工作 。 在 基于 BSD 的 套 接 字 实现 中 , 如 果 第 一 次 连 
接 尝试 失败 ， 那 么 在 TCP 中 继续 使 用 同一 个 套 接 字 描 述 符 ， 接 下 来 仍旧 会 失败 。 这 就 是 一 个 协议 
相关 的 行为 从 〈 协 议 无 关 的 ) 套 接 字 接口 中 显露 出 来 变 得 应 用 程序 可 见 的 例子 。 这 些 都 是 历史 原 
因 ， 因 此 Single UNIX Specification 敬告， 如果 connect 失败 ， 套 接 字 的 状态 会 变 成 未 定义 的 。 

因此 ， 如 果 connect 失败 ， 可 迁移 的 应 用 程序 需要 关闭 套 接 字 。 如 果 想 重 试 ， 必 须 打 开 一 
个 新 的 套 接 字 。 这 种 更 易于 迁移 的 技术 如 图 16-11 Pr. 


#include "apue.h" 
#include <sys/socket.h> 


#define MAXSLEEP 128 


int 
connect_retry(int domain, int type, int protocol, 
const struct sockaddr *addr, socklen t alen) 
{ 
int numsec, fd; 


/* 
* Try to connect with exponential backoff. 
*/ 
for (numsec = 1; numsec <= MAXSLEEP; numsec <<= 1) ( 
if ((fd = socket(domain, type, protocol)) < 0) 
returní-1); 
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if (connect(fd, addr, alen) == 0) { 
/* 
* Connection accepted. 
xy 
return (fd); 


} 
Close (fd); 


/* 
* Delay before trying again. 
*/ 
if (numsec <= MAXSLEEP/2) 
Sleepínumsec); 
} 
return(-1); 


图 16-11 可 迁移 的 支持 重 试 的 连接 代码 
需要 注意 的 是 ， 因 为 可 能 要 建立 一 个 新 的 套 接 字 , 给 connect retry 函数 传递 一 个 套 接 字 
描述 符 参 数 是 没有 意义 。 我 们 现在 返回 一 个 已 连接 的 套 接 字 措 述 符 给 调用 者 ， 而 并 非 返 回 一 个 表 
示 调 用 成 功 的 值 。 a" 


如 果 套 接 字 描述 符 处 于 非 阻 塞 模式 (该 模式 将 在 16.8 节 中 进一步 讨论 )， 那 么 在 连接 不 能 马 
上 建立 时 ，connect 将 会 返回 -1 并 且 将 errno 设置 为 特殊 的 错误 码 EINPROGRESS。 应 用 程序 
可 以 使 用 poll 或 者 select 来 判断 文件 描述 符 何 时 可 写 。 如 果 可 写 ， 连 接 完成 。 

connect 函数 还 可 以 用 于 无 连接 的 网 络 服务 (SOCK_DGRRAM)。 这 看 起 来 有 点 矛盾 ， 实 际 上 却 是 一 
个 不 错 的 选择 。 如 果 用 SOCK_DGRAM 套 接 字 调 用 connect, 传送 的 报 文 的 目标 地 址 会 设置 成 connect 
调用 中 所 指定 的 地 址 , 这 样 每 次 传送 报 文 时 就 不 需要 再 提供 地 址 。 另外, 仅 能 接收 来 自 指定 地 址 的 报 文 。 

服务 器 调用 listen 函数 来 宣告 它 愿意 接受 连接 请 求 。 





参数 backlog 提供 了 一 个 提示 ， 提 示 系 统 该 进程 所 pe 其 实际 值 
由 系统 决定 ， 但 上 限 由 <sys/socket .h> 中 的 SOMAXCONN 指定 。 


Solaris f X T «sys/socket.h»'P&j SOMAXCONN。 具 体 的 最 大 值 取决 于 每 个 协议 的 实 
| 现 。 对 于 TCP, HRV 128, 


一 旦 队列 满 ， 系 统 就 会 拒绝 多 余 的 连接 请 求 ， 所 以 backlog 的 值 应 该 基于 服务 器 期 望 负载 和 
处 理 量 来 选择 ， 其 中 处 理 量 是 指 接受 连接 请 求 与 启动 服务 的 数量 。 
一 旦 服务 器 调用 了 1isten， 所 用 的 套 接 字 就 能 接收 连接 请 求 。 使 用 accept 函数 获得 连接 
请 求 并 建立 连接 。 
#include <sys/socket.h> 


int accept (int sockfd, struct sockaddr ‘restrict addr, 
socklen t *restrict len); 





BE: GR, BE BRS) 描述 符 ， 若 出 错 ， 返 回 ~1 
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RM accept 所 返回 的 文件 描述 符 是 套 接 字 描 述 符 ， 该 描述 符 连 接 到 调用 connect 的 客户 
端 。 这 个 新 的 套 接 字 描述 符 和 原始 套 接 字 (sock) 具有 相同 的 套 接 字 类 型 和 地 址 族 。 传 给 accept 
的 原始 套 接 字 没 有 关联 到 这 个 连接 ， 而 是 继续 保持 可 用 状态 并 接收 其 他 连接 请 求 。 

如 果 不 关 心 客 户 端 标识 ， 可 以 将 参数 addr 和 len RA NULL. BM, AIA accept 之 前 ， 
将 addr 参数 设 为 足够 大 的 缓冲 区 来 存放 地 址 ， 并 且 将 Jen 指向 的 整数 设 为 这 个 缓冲 区 的 字 节 大 小 。 
EIN, accept 会 在 缓冲 区 填充 客户 端的 地 址 ， 并 且 更 新 指向 len 的 整数 来 反映 该 地 址 的 大 小 。 

如 果 没 有 连接 请 求 在 等 待 ， accept 会 阻塞 直到 一 个 请 求 到 来 。 如 果 sock/d 处 于 非 阻 塞 模式 ， 
accept 会 返回 -1， 并 将 errno RHA EAGAIN 或 EWOULDBLOCK. 


| 本 文中 讨论 的 所 有 平台 都 将 EAGAIN 定义 为 EWOULDBLOCK, 


如 果 服 务 器 调用 accept， 并 且 当 前 没有 连接 请 求 ， 服 务 器 会 阻塞 直到 一 个 请 求 到 来 。 另 外， 
服务 器 可 以 使 用 poll 或 select 来 等 待 一 个 请 求 的 到 来 。 在 这 种 情况 下 ， 一 个 带 有 等 待 连接 请 
求 的 套 接 字 会 以 可 读 的 方式 出 现 。 


5 实例 
16-12 显示 了 一 个 函数 ， 可 以 用 来 分 配 和 初始 化 套 接 字 供 服务 器 进程 使 用 。 


#include "apue.n" 
#include <errno.h> 
#include <sys/socket.h> 


int 
initserver(int type, const struct sockaddr *addr, socklen_t alen, 
int qlen) 
{ 
int fd; 
int err = 0; 


if ((fd = socket (addr->sa_family, type, 0)) < 0) 
return(-1):; 

if (bind(fd, addr, alen) « O0) 
goto errout; 

if (type == SOCK STREAM || type == SOCK SEQPACKET) { 
if (listen(fd, qlen) < 0) 

goto errout; 
} 
return (fd); 


errout: 
err = errno; 
close {fd}; 


errno = err; 
return {-1); 


16-12 初始 化 一 个 套 接 字 端 点 供 服务 器 进程 使 用 
可 以 看 到 ，TCP 有 一 些 奇 怪 的 地 址 复 用 规则 ， 这 使 得 这 个 例子 不 完备 。 图 16-22 显示 了 有 关 
这 个 函数 的 另 一 个 版 本 ， 可 以 绕 过 这 些 规则 ， 解 决 此 版 本 的 主要 缺陷 。 "i 
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既然 一 个 套 接 字 端点 表示 为 一 个 文件 描述 符 , 那么 只 要 建立 连接 , 就 可 以 使 用 read 和 write 
来 通过 套 接 字 通 信 。 回 忆 前 面 所 讲 ， 通 过 在 connect 函数 里 面 设 置 默认 对 等 地 址 ， 数 据 报 套 接 
字 也 可 以 被 “连接 ”。 在 套 接 字 描述 符 上 使 用 read 和 write 是 非常 有 意义 的 ， 因 为 这 意味 着 可 
以 将 套 接 字 描述 符 传递 给 那些 原先 为 处 理 本 地 文件 而 设计 的 函数 。 而 且 还 可 以 安排 将 套 接 字 描 述 
符 传 递 给 子 进程 ， 而 该 子 进程 执行 的 程序 并 不 了 解 套 接 字 。 

尽管 可 以 通过 read 和 write 交换 数据 , 但 这 就 是 这 两 个 函数 所 能 做 的 一 切 。 如果 想 指定 选 
项 ， 从 多 个 客户 端 接收 数据 包 ， 或 者 发 送 带 外 数据 ， 就 需要 使 用 6 个 为 数据 传递 而 设计 的 套 接 字 
函数 中 的 一 个 。 

3 个 函数 用 来 发 送 数据 ，3 个 用 于 接收 数据 。 首 先 ， 考 碍 用 于 发 送 数据 的 函数 。 

最 简单 的 是 send， 它 和 write 很 像 ， 但 是 可 以 指定 标志 来 改变 处 理 传输 数据 的 方式 。 


#include <sys/socket.h> 


ssize t send(int sockfd, const void *buf, size t nbytes, int flags); 


返回 值 ， 若 成 功 ， 返 回 发 送 的 字 节 数 ， 若 出 错 ， 返 回 -1 





类 似 write. H send 时 套 接 字 必须 已 经 连接 。 参 数 buf 和 nbytes 的 含义 与 write 中 的 
一 致 。 

然而 ,与 write SAKE, send 支持 第 4 个 参数 flags. 3 个 标志 是 由 Single UNIX Specification 
定义 的 ， 但 是 具体 系统 实现 支持 其 他 标志 的 情况 也 是 很 常见 的 。 图 16-13 总 结 了 这 些 标志 。 
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延迟 发 送 数据 包 人 允许 写 更 多 数据 

在 写 无 连接 的 套 接 字 时 不 产生 
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MSG DONTROUTE 
MSG DONTWAIT 
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图 16-13 send 套 接 字 调用 标志 
即使 send 成 功 返 回 ， 也 并 不 表示 连接 的 另 一 端的 进程 就 一 定 接收 了 数据 。 我 们 所 能 保证 的 
只 是 当 send 成 功 返回 时 ， 数 据 已 经 被 无 错误 地 发 送 到 网 络 驱动 程序 上 。 
对 于 支持 报 文 边界 的 协议 ， 如 果 尝 试 发 送 的 单个 报 文 的 长 度 超 过 协议 所 支持 的 最 大 长 度 ， 那 
4 send 会 失败 ， 并 将 errno 设 为 EMSGSIZE。 对 于 字 节 流 协议 ，send 会 阻塞 直到 整个 数据 传 
输 完成 。 函 数 sendto 和 send 很 类 似 。 区 别 在 于 sendato 可 以 在 无 连接 的 套 接 字 上 指定 一 个 目 
标 地 址 。 
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#include <sys/socket.h> 


ssize t sendto(int sockfd, const void *buf, size_t nbytes, int flags, 


const struct sockaddr *destaddr, socklen t destlen); 
返回 值 ， 著 成功 ， 返 回 发 送 的 字 节 数 ， 若 出 错 ， 返 回 -1 
对 于 面向 连接 的 套 接 字 , 目标 地 址 是 被 忽略 的 , 因为 连接 中 隐 含 了 目标 地 址 。 对 于 无 连接 的 套 接 字 ， 
除非 先 调用 connect 设置 了 目标 地 址 ,否则 不 能 使 用 send. sendto 提供 了 发 送 报 文 的 另 一 种 方式 。 
通过 套 接 字 发 送 数据 时 ， 还 有 一 个 选择 。 可 以 调用 带 有 msghdr 结构 的 sendmsg 来 指定 多 
重 缓冲 区 传输 数据 ， 这 和 writev 函数 很 相似 〈 见 14.6 节 )。 


#include <sys/socket.h> 





ssize_t sendmsg(int sockd, const struct msghdr *msg, int flags); 
返回 值 ， 若 成 功 ， 返 回 发 送 的 字 节 数 ， 若 出 错 ， 返 回 -1 
POSIX.1 定义 了 msghdr 结构 ， 它 至 少 有 以 下 成 员 : 


struct msghdr { 





void *msg name; /* optional address */ 

socklen t msg namelen; /* address size in bytes */ 
struct iovec  *msg iov; /* array of I/O buffers */ 

int msg iovlen; /* number of elements in array */ 
void *msg control; /* ancillary data */ 

socklen t msg controllen; /* number of ancillary bytes */ 
int msg flags; /* flags for received message */ 


* 


) 
在 14.6 节 中 可 以 看 到 iovec 结构 。 在 17.4 节 中 可 以 看 到 辅助 数据 的 使 用 。 
MAM recv 和 read 相似 ， 但 是 recv 可 以 指定 标志 来 控制 如 何 接收 数据 。 


#include <sys/socket.h> 


ssize t recv(int sockfd, void *buf, size t nbytes, int flags); 


MSG CMSG CLOEXEC 为 UNIX 域 套 接 字 上 接收 的 
文件 描述 符 设 置 执行 时 关闭 标 
志 ( 见 17.4 节 ) 

MSG DONTWAIT 启用 非 阻塞 操作 (相当 于 使 
FH o NONBLOCK) 

MSG ERRQUEUE 接收 错误 信息 作为 辅助 数据 

MSG OOB 如 果 协 议 支持 ， 获 取 带 外 数 
# ( 见 16.7 节 )》 

MSG_PEEK 返回 数据 包 内 容 而 不 真正 取 
走 数据 包 

MSG_TRUNC 即使 数据 包 被 截断 ， 也 返回 
数据 包 的 实际 长 度 


MSG WAITALL 等 待 直 到 所 有 的 数据 可 用 ( 仅 
SOCK STREAM) 


16-14 recv 套 接 字 调 用 标志 
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当 指 定 MSG_PEEK 标志 时 ， 可 以 查看 下 一 个 要 读 取 的 数据 但 不 真正 取 走 它 。 当 再 次 调用 read 
或 其 中 一 个 recv 函数 时 ， 会 返回 刚才 查看 的 数据 。 

对 于 SOCK_STREAM 套 接 字 ， 接 收 的 数据 可 以 比 预 期 的 少 。MSG_WRITRALL 标志 会 阻止 这 种 
行为 , 直到 所 请 求 的 数据 全 部 返回 , recv 函数 才 会 返回 。 对 于 SOCK_DGRAM 和 SOCK_SEOPRCKET 
BEF, MSG_WAITALL 标志 没有 改变 什么 行为 ， 因 为 这 些 基 于 报 文 的 套 接 字 类 型 一 次 读 取 就 返 


回 整个 报 文 。 
如 果 发 送 者 已 经 调用 shutdown (A 16.2 W) 来 结束 传输 ， 或 者 网 络 协议 支持 按 默认 的 顺序 
关闭 并 且 发 送 端 已 经 关闭 ， 那 么 当 所 有 的 数据 接收 完毕 后 ，recy 会 返回 0. 


如 果 有 兴趣 定位 发 送 者 ， 可 以 使 用 recvfrom 来 得 到 数据 发 送 者 的 源 地 址 。 


#include <sys/socket.h> 


ssize t recvfrom(int sockfd, void *restrict buf, size t len, int flags, 


struct sockaddr *restrict addr, 
Socklen t *restrict addrien); 


返回 值 : 返回 数据 的 字 节 长 度 : 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 若 出 错 ， 返 回 -1 

如 果 addr 非 空 ， 它 将 包含 数据 发 送 者 的 套 接 字 端 点 地 址 。 当 调用 recvfrom 时 ， 需 要 设置 
addrlen 参数 指向 一 个 整数 ， 该 整数 包含 addr 所 指向 的 套 接 字 缓 冲 区 的 字 节 长 度 。 返 回 时 ， 该 整 
数 设 为 该 地 址 的 实际 字 节 长 度 。 

因为 可 以 获得 发 送 者 的 地 址 ，recvfrom 通常 用 于 无 连接 的 套 接 字 。 否 则 ，recvfzrom 等 同 
F recv. 

为 了 将 接收 到 的 数据 送 入 多 个 缓冲 区 ， 类 似 于 readv COL 14.6 节 )， 或 者 想 接 收 辅助 数据 
CH 17.4 节 )， 可 以 使 用 recvmsg。 


#include «sys/socket.h» 





ssize t recvmsg(int sockfd, struct msghdr *msg, int flags); 


返回 值 ， 返回 数据 的 字 节 长 度 ， 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0， 若 出 错 ， 返 回 -1! 





recvmsg JH msghdr 结构 (在 sendmsg PRA) 指定 接收 数据 的 输入 缓冲 区 。 可 以 设置 
参数 flags 来 改变 recvmsg 的 默认 行为 。 返 回 时 ，msghdr 结构 中 的 msg flags 字段 被 设 为 所 
接收 数据 的 各 种 特征 。( 进 入 recvmsg 时 msg_flags 被 忽略 。) recvmsg 中 返回 的 各 种 可 能 值 
总 结 在 图 16-15 中 。 我 们 将 在 第 17 章 看 到 使 用 recvmsg 的 实例 。 


FreeBSD Mac OS 
示 志 
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MSG_CTRUNC 控制 数据 被 截断 





















MSG EOR 接收 记录 结束 符 
MSG_ERROUEUE | 接收 错误 信息 作为 辅助 数据 
MSG OOB 接收 带 外 数据 


一 般 数据 被 截断 
图 16-15 从 recvmsg 中 返回 的 msg_flags 标志 613 


图 16-16 显示 了 一 个 与 服务 器 通信 的 客户 端 从 系统 的 uptime 命令 获得 输出 。 我 们 把 这 个 服 
务 称 为 “远程 正常 运行 时 间 ”(remote uptime) (简写 为 “ruptime”)。 





MSG_TRUNC 
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#include "apue.h" 
#include <netdb.h> 
#include <errno.h> 
#include <sys/socket.h> 


#define BUFLEN 128 


extern int connect retry(int, int, int, const struct sockaddr *, 
socklen_t); 


void 
print_uptime (int sockfd) 
{ 

int n; 

char buf [BUFLEN] ; 


while ((n = recv(sockfd, buf, BUFLEN, 0)) > 0) 
write(STDOUT FILENO, buf, n)? 

if (n < O0) 
err sys("recv error"); 


int 

Main(int argc, char *argv[]) 

{ 
struct addrinfo *ailist, *aip; 
struct addrinfo hint; 
int sockfd, err: 


if (argc != 2) 

err quit("usage: ruptime hostname"); 
memset (&hint, 0, sizeof(hint)):; 
hint.ai_socktype = SOCK_STREAM; 
hint.ai_canonname = NULL; 
hint.ai_addr = NULL; 
hint.ai_next = NULL; 


if ((err = getaddrinfo(argv[1], "ruptime", &hint, &ailist)) != 0) 
err quit("getaddrinfo error: $s", gai strerror(err)); 
for (aip = ailist; aip != NULL; aip = aip->ai_next) { 


if ((sockfd = connect retry(aip-»ai family, SOCK STREAM, 0, 
aip-»ai addr, aip-»ai addrlen)) < 0) { 
err - errno; 
) else ( 
print uptime (sockfd) ; 
exit(0); 


} 


err exit (err, "can't connect to %s", argv[1]): 


图 16-16 AIF AR Ar SEHE IE à (TRE RI P dr 
XA RHEXEHEHRARGE, VERUM ÓÓRARORGXOXOK(UDIETIPOBGPBÉRRÁATEMEREESS B. DE UBGTE 
SOCK STREAM 套 接 字 ， 所 以 不 能 保证 调用 一 次 recv 就 会 读 取 整 个 字符 串 ， 因 此 需要 重复 调用 
直到 它 返回 0。 
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如 果 服 务 器 支持 多 重 网 络 接口 或 多 重 网 络 协议 ， 函数 getaddrinfo 可 能 会 返回 多 个 候选 地 
址 供 使 用 。 轮 流 尝试 每 个 地 址 ， 当 找到 一 个 允许 连接 到 服务 的 地 址 时 便 可 停止 。 使 用 图 16-11 T 
的 connect retry 函数 来 与 服务 器 建立 一 个 连接 。 “i 


m 实例 : 面向 连接 的 服务 器 
图 16-17 展示 了 服务 器 程序 ， 用 来 提供 uptime 命令 的 输出 到 图 16-16 所 示 的 客户 端 程序 。 


#include "apue.h" 
#include <netdb.h> 
#include <errno.h> 
#include <syslog.h> 
finclude <sys/socket.h> 


#define BUFLEN 128 
#define QLEN 10 


#ifndef HOST NAME MAX 
#define HOST NAME MAX 256 
fendif 


extern int initserver(int, const struct sockaddr *, socklen t, int); 
void 


serve(int sockfd) 


( 


int clfd; 
FILE *fp; 
char buf [BUFLEN] ; 


set cloexec(sockfd); 
for (77) { 
if ((clfd = accept (sockfd, NULL, NULL)) < 0) { 
syslog(LOG ERR, "ruptimed: accept error: $s", 
strerror(errno)); 
exit(l); 
} 
set, cloexec(clfd); 
if ((fp = popen("/usr/bin/uptime", "r")) == NULL) { 
sprintf (buf, "error: $sMn", strerror(errno)); 
send(clfd, buf, strlen(buf), 0); 
} else { 
while (fgets (buf, BUFLEN, fp) != NULL) 
send(clfd, buf, strlen(buf), 0); 
pclose (fp); 
} 
close (clfd); 


int 
main(int argc, char *argv[]) 
{ 


struct addrinfo *ailist, *aip; 
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struct addrinfo hint; 
int sockfd, err, n; 
chax *host; 


if (argc != 1) 
err quit("usage: ruptimed"); 
if ((n = sysconf(, SC HOST NAME MAX)) < 0) 
n = HOST NAME MAX; /* best guess */ 
if ((host = malloc{n)) == NULL) 
err sys("malloc error"); 
if (gethostname(host, n) « O) 
err sys("gethostname error"); 
daemonize ("ruptimed"); 
memset(&hint, 0, sizeof(hint)); 
hint.ai flags = AI CANONNAME; 
hint.ai socktype - SOCK STREAM; 
hint.ai canonname = NULL; 
hint.ai addr - NULL; 
hint.ai next = NULL; 
if ((err = getaddrinfo(host, "ruptime", &hint, &ailist)) !- 0) { 
Syslog(LOG ERR, "ruptimed: getaddrinfo error: %s", 
gai strerror(err)); 
exit(1); 
) 
for (aip = ailist; aip != NULL; aip = aip-»ai next) { 
if ((sockfd = initserver(SOCK STREAM, aip->ai_addr, 
aip-»ai addrlen, QLEN)) >= 0} [ 
serve(sockfd); 
exit (0); 
} 
} 
exit (1); 
} 


16-17 提供 系统 正常 运行 时 间 的 服务 器 程序 

为 了 找到 它 的 地 址 ， 服 务 器 需要 获得 其 运行 时 的 主机 名 。 如 果 主 机 名 的 最 大 长 度 不 确定 ， 可 
以 使 用 HOST. NAME MAX 代替 。 如 果 系 统 没 定义 HOST_NAME_MAX， 可 以 自己 定义 。POSIX.1 要 
求 主 机 名 的 最 大 长 度 至 少 为 255 字 节 ， 不 包括 终止 null 字符 ， 因 此 定义 HOST. NAME MAX 为 256 
来 包括 终止 null 字符 。 

服务 器 调用 gethostname 获得 主机 名 ， 查 看 远程 正常 运行 时 间 服 务 的 地 址 。 可 能 会 有 多 个 
地 址 返回 ， 但 我 们 简单 地 选择 第 一 个 来 建立 被 动 套 接 字 端点 〈 即 一 个 只 用 于 监听 连接 请 求 的 地 
址 )。 处 理 多 个 地 址 作为 习题 留 给 读者 。 

使 用 图 16-12 的 initserver 函数 来 初始 化 套 接 字 端 点 ， 在 这 个 端点 上 等 待 到 来 的 连接 请 求 。 
《实际 上 ， 使 用 的 是 图 16-22 的 版 本 ;在 16.6 节 中 讨论 套 接 字 选 项 时 ， 可 以 了 解 其 中 的 原因 。) m” 


aX: 另 一 个 面向 连接 的 服务 器 


前 面 说 过 ， 采 用 文件 描述 符 来 访问 套 接 字 是 非常 有 意义 的 ， 因 为 它 允 许 程序 对 联网 环境 的 网 
络 访问 一 无 所 知 。 图 16-18 中 所 示 的 服务 器 程序 版 本 说 明了 这 一 点 。 服 务 器 没有 从 uptime 命令 
中 读 取 输 出 并 发 送 到 客户 端 ， 而 是 将 uptime 命令 的 标准 输出 和 标准 错误 安排 成 为 连接 到 客户 端 
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的 套 接 字 端 点 。 


#include "apue.h" 
#include «netdb.h» 
#include «errno.h» 
#include «syslog.h» 
#include «fcntl.h» 
#include «sys/socket.h» 
#include <sys/wait.h> 


#define QLEN 10 


#ifndef HOST NAME MAX 
#define HOST NAME MAX 256 
#fendif 


extern int initserver(int, const struct sockaddr *, socklen t, int); 


void 

serve(int sockfd) 

1 
int clfd, status; 
pid t pid; 


set cloexec(sockfd); 
for (;;) 1 
if ((clfd = accept (sockfd, NULL, NULL)) < 0) ( 
syslog (LOG_ERR, "ruptimed: accept error: %s", 
strerror (errno) }; 
exit(1); 
} 
if (ipid = fork()) < 0) I 
syslog(LOG_ERR, "ruptimed: fork error: %s", 
strerror(errno)); 
exit(1); 
} else if (pid == 0) { /* child */ 


* The parent called daemonize (Figure 13.1), so 

* STDIN FILENO, STDOUT FILENO, and STDERR FILENO 

* are already open to /dev/null. Thus, the call to 
* close doesn't need to be protected by checks that 
* clfd isn't already equal to one of these values. 


if (dup2(clfd, STDOUT FILENO) != STDOUT FILENO || 
dup2(clfd, STDERR FILENO) != STDERR FILENO) { 
syslog(LOG ERR, "ruptimed: unexpected error"); 
exití1); 
] 
close (clfd); 
execl("/usr/bin/uptime", "uptime", (char *)0); 
syslog (LOG_ERR, "ruptimed: unexpected return from exec: %s", 
strerror(errno)); 
} else { /* parent */ 
close (clfd); 
waitpid(pid, &status, 0); 
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} 


int 

main(int argc, char *argv[]) 

{ 
struct addrinfo *ailist, *aip; 
struct addrinfo hint; 
int sockfd, err, n; 
char *host; 


if (argc !- 1) 
err quit("usage: ruptimed"); 
if ((n = syscon£( SC HOST, NAME MAX)) < 0} 
n = HOST NAME MAX; /* best guess */ 
if ((host = malloc(n)) == NULL) 
err sys("malloc error"); 
if (gethostname (host, n) < 0) 
err_sys("gethostname error"); 
daemonize ("ruptimed"); 
memset (&hint, 0, sizeof (hint)); 
hint.ai_flags = AI_CANONNAME; 
hint.ai_socktype = SOCK_STREAM; 
hint.ai_canonname = NULL; 
hint.ai_addr = NULL; 
hint.ai_next = NULL; 
if ((err = getaddrinfo(host, "ruptime", &hint, &ailist)) !- 0) ( 
syslog (LOG ERR, "ruptimed: getaddrinfo error: $s", 
gai strerror(err)); 
exit(1); 
} 
for (aip = ailist; aip != NULL; aip = aip->ai_next) { 
if ((sockfd = initserver(SOCK STREAM, aip~->ai_addr, 
aip->ai_addrlen, QLEN)) >= Q) I 
serve (sockfd); 
exit (0); 
} 
} 
exit (1); 


图 16-18 用 于 说 明 命令 直接 写 到 套 接 字 的 服务 器 程序 


我 们 没有 采用 popen 来 运行 uptime 命令 ， 并 从 连接 到 命令 标准 输出 的 管道 读 取 输出 ， 而 是 
采用 fork 创建 了 一 个 子 进程 , 然后 使 用 dup2 使 STDIN_FILENO 的 子 进程 副本 对 /dev/null FF 
放 ， 使 sTDOUT FILENO 和 STDERR FILENO 的 子 进程 副本 对 套 接 字 端 点 开放 。 当 执行 uptime 
时 ， 命 令 将 结果 写 到 它 的 标准 输出 ， 该 标准 输出 是 连接 到 套 接 字 的 ， 所 以 数据 被 送 到 ruptime 客 
户 端 命令 。 

父 进 程 可 以 安全 地 关闭 连接 到 客户 端的 文件 描述 符 ， 因 为 子 进程 仍旧 让 它 打开 着 。 父 进程 会 
等 待 子 进程 处 理 完 毕 再 继续 ， 所 以 子 进程 不 会 变 成 优 死 进程 。 由 于 运行 uptime 命令 不 会 花费 太 
长 的 时 间 ， 所 以 父 进程 在 接受 下 一 个 连接 请 求 之 前 ， 可 以 等 待 子 进程 退出 。 然 而 ， 如 果子 进程 运 


ii 


行 的 时 间 比 较 长 的 话 ， 这 种 策略 就 未 必 适 合 了 。 " 
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前 面 的 实例 采用 的 都 是 面向 连接 的 套 接 字 。 但 如 何 选择 合适 的 套 接 字 类 型 呢 ? 何 时 采用 面 
向 连接 的 套 接 字 ， 何 时 采用 无 连接 的 套 接 字 呢 ? 答案 取决 于 我 们 要 做 的 工作 量 和 能 够 容忍 的 出 
错 程度 。 

对 于 无 连接 的 套 接 字 ， 数 据 包 到 达 时 可 能 已 经 没有 次 序 ， 因 此 如 果 不 能 将 所 有 的 数据 放 在 一 
个 数据 包 里 ， 则 在 应 用 程序 中 就 必须 关心 数据 包 的 次 序 。 数 据 包 的 最 大 尺寸 是 通信 协议 的 特征 。 
另外 ， 对 于 无 连接 的 大 接 字 ， 数 据 包 可 能 会 丢失 。 如 果 应 用 程序 不 能 容忍 这 种 丢失 ， 必 须 使 用 面 
向 连接 的 套 接 字 。 

容忍 数据 包 丢失 意味 着 两 种 选择 。 一 种 选择 是 ， 如 果 想 和 对 等 方 可 靠 通 信 ， 就 必须 对 数据 包 
编号 ， 并 且 在 发 现 数据 包 丢失 时 ， 请 求 对 等 应 用 程序 重 传 ， 还 必须 标识 重复 数据 包 并 丢弃 它们 ， 
因为 数据 包 可 能 会 延迟 或 疑似 丢失 ， 可 能 请 求 重 传 之 后 ， 它 们 又 出 现 了 。 [619] 

另 一 种 选择 是 ， 通 过 让 用 户 再 次 尝试 那个 命令 来 处 理 错误 。 对 于 简单 的 应 用 程序 ， 这 可 能 就 
足够 了 ， 但 对 于 复杂 的 应 用 程序 ， 这 种 选择 通常 不 可 行 。 因 此 ， 一 般 在 这 种 情况 下 使 用 面向 连接 
的 套 接 字 比较 好 。 

面向 连接 的 套 接 字 的 缺陷 在 于 需要 更 多 的 时 间 和 工作 来 建立 -- 个 连接 ， 并 且 每 个 连接 都 需要 
消耗 较 多 的 操作 系统 资源 。 


壮实 例 : 无 连接 的 客户 端 
16-19 中 的 程序 是 采用 数据 报 套 接 字 接 口 的 uptime 客户 端 命 令 版 本 。 


#include "apue.h" 
#include <netdb.h> 
#include «errno.h» 
#include <sys/socket.h> 


#define BUFLEN 128 
#define TIMEOUT 20 
void 


sigalrm(int signo} 
{ 
} 


void 
print uptime(int sockfd, struct addrinfo *aip) 
{ 


int n; 
char buf [BUFLEN] ; 
buf(0] = 0; 


if (sendto(sockfd, buf, 1, 0, aip-»ai addr, aip-»ai addrlen) < 0) 
err sys("sendto error"); 
alarm (TIMEOUT); 
if ((n = recvfrom(sockfd, buf, BUFLEN, 0, NULL, NULL)) < O) 1 
if (errno !- EINTR) 
alarm(0); 
err sys("recv error"); 
} 
alarm(0); 
write(STDOUT FILENO, buf, n); 
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} 


int 
main(int argc, char *argv[]) 


{ 


struct addrinfo *ailist, *aip; 
struct addrinfo hint; 

int sockfd, err; 

struct sigaction sa; 


if (argc !- 2) 
err quit("usage: ruptime hostname"); 

sa.sa handler - sigalrm; 

sa.sa flags = 0; 

sigemptysetí(&sa.sa mask); 

if (sigaction(SIGALRM, &sa, NULL) « 0) 
err Sys("sigaction error"); 

memset (&hint, 0, sizeof(hint)); 

hint.ai_socktype = SOCK_DGRAM; 

hint.ai_canonname = NULL; 

hint.ai addr = NULL; 

hint.ai_next = NULL; 

if ((err = getaddrinfo(argv[1], "ruptime", &hint, &ailist)) != 0) 
err quit("getaddrinfo error: ts", gai strerror(err)): 


for {aip = ailist; aip != NULL; aip = aip-»ai next) I 
if ((sockfd = socket(aip-»ai family, SOCK DGRAM, 0)) < 6) { 
err - errno; 
) else ( 
print uptime(sockfd, aip); 
exit (0}; 


} 


fprintf(stderr, "can't contact ts: %s\n", argv[1], strerror(err)); 
exit(1); 


16-19 采用 数据 报 服务 的 客户 端 命令 


除了 增加 安装 一 个 SIGALRM 的 信号 处 理 程 序 以 外 ， 基 于 数据 报 的 客户 端 中 的 main 函数 和 
面向 连接 的 客户 端 中 的 类 似 。 使 用 alarm 函数 来 避免 调用 recvfrom 时 的 无 限期 阻塞 。 
对 于 面向 连接 的 协议 ， 需 要 在 交换 数据 之 前 连接 到 服务 器 。 对 于 服务 器 来 说 ， 到 来 的 连 
接 请 求 已 经 足够 判断 出 所 需 提 供给 客户 端的 服务 。 但 是 对 于 基于 数据 报 的 协议 ， 需 要 有 一 种 
方法 通知 服务 器 来 执行 服务 。 本 例 中 ， 只 是 简单 地 向 服务 器 发 送 了 1 字 节 的 数据 。 服 务 器 将 
接收 它 ， 从 数据 包 中 得 到 地 址 ， 并 使 用 这 个 地 址 来 传送 它 的 响应 。 如 果 服 务 器 提供 多 个 服务 ， 
可 以 使 用 这 个 请 求 数据 来 表示 需要 的 服务 , 但 由 于 服务 器 只 做 一 件 事 情 ，1 字 节 数据 的 内 容 是 
无 关 紧 要 的 。 
如 果 服 务 器 不 在 运行 状态 ， 客 户 端 调用 recvfrom 便 会 无 限期 阻塞 。 对 于 这 个 面向 连接 的 实 
例 ， 如 果 服 务 器 不 运行 ，connect 调用 会 失败 。 为 了 避免 无 限期 阻塞 ， 可 以 在 调用 recvfrom 
之 前 设置 警告 时 钟 。 - 
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"m 实例 : 无 连接 的 服务 器 
图 16-20 所 示 的 程序 是 uptime 服务 器 的 数据 报 版 本 。 


#include "apue.h" 
#include <netdb.h> 
#include <errno.h> 
#include <syslog.h> 
#include <sys/socket.h> 





#define BUFLEN 128 
#define MAXADDRLEN 256 


#ifndef HOST NAME MAX 
#define HOST_NAME MAX 256 
#endif 


extern int initserver(int, const struct sockaddr *, socklen_t, int); 
void 


serve(int sockfd) 
{ 


int n; 

Ssocklen t alen; 

FILE *fp; 

char buf [BUFLEN]; 

char abuf [MAXADDRLEN] ; 


Struct sockaddr *addr = (struct sockaddr *)abuf; 


set cloexec(sockfd): 
for (::) { 
alen = MAXADDRLEN; 
if ((n = recvfrom(sockfd, buf, BUFLEN, 0, addr, &alen)) < 0) { 
SySlog(LOG ERR, "ruptimed: recvfrom error: $s", 
strerror(errno)): 
exit (1); 
} 
if ((fp = popen("/usr/bin/uptime", "r")) == NULL) { 
sprintf(buf, "error: $*sMn", strerror(errno)); 
sendto(sockfd, buf, strlen(buf), 0, addr, alen); 
) else ( 
if (fgets(buf, BUFLEN, fp) !- NULL) 
sendto(sockfd, buf, strlen(buf), 0, addr, alen); 
pclose (fp}; 


int 

main(int argc, char *argv[]) 

{ 
struct addrinfo ‘*ailist, *aip; 
struct addrinfo hint; 
int sockfd, err, n; 
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char *host; 


if (argc !- 1) 
err quit("usage: ruptimed"); 
if (tn = sysconf( SC HOST NAME MAX)) < 0} 
n = HOST NAME MAX; /* best guess */ 
if ((host = mallocí(n)) == NULL) 
err sys("malloc error"); 
if (gethostname(host, n) < 0) 
err sys("gethostname error"); 
daemonize ("ruptimed"); 
memset(&hint, 0, sizeof(í(hint)): 
hint.ai flags - AI, CANONNAME; 
hint.ai socktype = SOCK_DGRAM; 
hint.ai canonname = NULL; 
hint.ai addr - NULL; 
hint.ai next - NULL; 
if ((err = getaddrinfo(host, "ruptime", &hint, &ailist)) !- 0) { 
syslog(LOG ERR, "ruptimed: getaddrinfo error: $s", 
gai strerror(err)); 
exití(1); 
} 
for (aip = ailist; aip != NULL; aip = aip->ai_next) { 
if ((sockfd = initserver(SOCK DGRAM, aip->ai_addr, 
aip->ai_addrlen, 0)) >= 0) { 
serve (sockfd) ; 
exit (0); 
} 
} 
exit(1); 


16-20 ”基于 数据 报 提 供 系统 正常 运行 时 间 的 服务 器 


服务 器 在 recvfrom 阻塞 等 待 服务 请 求 。 当 一 个 请 求 到 达 时 ， 保 存 请 求 者 地 址 并 使 用 popen XZ 
行 uptime 命令 。 使 用 sendto 函数 将 输出 发 送 到 客户 端 ， 将 目标 地 址 设置 成 刚才 的 请 求 者 地 址 。 an 


16.6 ERFAN 


套 接 字 机 制 提 供 了 两 个 套 接 字 选 项 接口 来 控制 套 接 字 行为 。 一 个 接口 用 来 设置 选项 ， 另 一 个 
接口 可 以 查询 选项 的 状态 。 可 以 获取 或 设置 以 下 3 种 选项 。 

(D 通用 选项 ， 工 作 在 所 有 套 接 字 类 型 上 。 

(2) 在 套 接 字 层 次 管理 的 选项 ， 但 是 依赖 于 下 层 协 议 的 支持 。 

(3) 特定 于 某 协议 的 选项 ， 每 个 协议 独 有 的 。 

Single UNIX Specification 定义 了 套 接 字 层 的 选项 《上述 选 项 中 的 前 两 个 选项 类 型 )。 

可 以 使 用 setsockopt 函数 来 设置 套 接 字 选项 。 


#include <sys/socket.h> 


int setsockopt(int sockfd, int level, int option, const void *val, 


socklen t len): 





返回 值 : FRA., eo Hie. i 
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BR level 标识 了 选项 应 用 的 协议 。 如 果 选 项 是 通用 的 套 接 字 层次 选项 ， 则 level 设置 成 
SOL SOCKET. il, level 设置 成 控制 这 个 选项 的 协议 编号 。 对 于 TCP 选项 ，level 是 IPPROTO_TCP; 
Xt IP, level 是 TPPROTO_IP。 图 16-21 总 结 了 Single UNIX Specification 中 定义 的 通用 套 接 字 
层次 选项 。 


SO_ACCEPTCONN | int 返回 信息 指示 该 套 接 字 是 否 能 被 监听 〔 仅 getsockopt) 
SO. BROADCAST int 如 果 *val 非 0， 广 播 数 据 报 

SO, DEBUG int 如 果 *val 非 0， 启 用 网 络 驱 动 调 试 功能 

SO DONTROUTE int 如 果 *val 非 0， 绕 过 通常 路 由 

SO, ERROR int 返回 挂 起 的 套 接 字 错 误 并 清除 (X getsockopt) 
SO, KEEPALIVE int 如 果 *val 非 0， 启 用 周期 性 keep-alive 报 文 

SO, LINGER struct linger 当 还 有 未 发 报 文 而 套 接 字 已 关闭 时 ， 延 述 时 间 
SO, OOBINLINE i 如 果 *val 非 0， 将 带 外 数据 放 在 普通 数据 中 

SO RCVBUF int 接收 缓冲 区 的 字 节 长 度 

SO RCVLOWAT i 接收 调用 中 返回 的 最 小 数据 字 节 数 

SO RCVTIMEO struct timeval | 套 接 字 接 收 调用 的 超时 值 

SO. REUSEADDR int iniR*valdEO, BAA bind 中 的 地 址 

SO SNDBUF int 发 送 缓冲 区 的 字 节 长 度 

SO. SNDLOWAT int 发 送 调用 中 传送 的 最 小 数据 字 节 数 

SO_SNDTIMEO struct timeval | 套 接 字 发 送 调用 的 超时 值 

SO_TYPE int 标识 套 接 字 类 型 (X getsockopt) 


图 16-21 BRP RM 
参数 val 根据 选项 的 不 同 指向 一 个 数据 结构 或 者 一 个 整数 。 一 些 选项 是 on/off TK. MRE 
数 非 0， 则 启用 选项 。 如 果 整 数 为 0， 则 禁止 选项 。 参 数 len 指定 了 val 指向 的 对 象 的 大 小 。 
可 以 使 用 getsockopt 函数 来 查看 选项 的 当前 值 。 


#include <sys/socket.h> 





int getsockopt {int sockfd, int level, int option, void *restrict val, 
socklen_t *restrict lenp); 


RPA: Be, EO; 若 出 错 ， 返 回 -1 





参数 lenp 是 一 个 指向 整数 的 指针 。 在 调用 getsockopt 之 前 ， 设 置 该 整数 为 复制 选项 缓冲 
区 的 长 度 。 如 果 选 项 的 实际 长 度 大 于 此 值 ， 则 选项 会 被 截断 。 如 果实 际 长 度 正 好 小 于 此 值 ， 那 么 
返回 时 将 此 值 更 新 为 实际 长 度 。 


^. 实例 


当 服 务 器 终止 并 尝试 立即 重启 时 ， 图 16-12 中 的 函数 将 无 法 正常 工作 。 通 常情 况 下 ， 除 非 超 
时 (超时 时 间 一 般 是 几 分 钟 )， 否 则 TCP 的 实现 不 允许 绑 定 同一 个 地 址 。 幸 运 的 是 ， 套 接 字 选项 
SO REUSEADDR 可 以 绕 过 这 个 限制 ， 如 图 16-22 Ara. 





#include "apue.h" 
#include <errno.h> 
#include <sys/socket.h> 


int 
jnitserver (int type, const struct sockaddr *addr, socklen t alen, 
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int qlen) 
{ 
int fd, err; 
int reuse - 1; 


if ((fd = socket (addr->sa_family, type, 0)) < 0) 
returní-1); 
if (setsockopt(fd, SOL SOCKET, SO REUSEADDR, &reuse, 
sizeof(int)) < 0) 
goto errout; 
if (bind(fd, addr, alen) « 0) 
goto errout; 
if (type == SOCK STREAM || type -- SOCK SEQPACKET) 
if (listen(fd, glen) < 0) 
goto errout; 
return (fd); 


errout: 
err = errno; 
close (fd); 


errno = err; 
return(-1); 


图 16-22 采用 地 址 复 用 初始 化 套 接 字 端 点 供 服务 器 使 用 


为 了 启用 SO_REUSEADDR 选项 , 设置 了 一 个 非 0 值 的 整数 ， 并 把 这 个 整数 地 址 作为 val 参数 
传递 给 了 setsockopt。 将 len 参数 设置 成 了 一 个 整数 大 小 来 表明 val 所 指 的 对 象 的 大 小 。 oo 


16.7 ” 带 外 数据 


带 外 数据 (out-of-band data) 是 一 些 通 信 协 议 所 支持 的 可 选 功能 ， 与 普通 数据 相 比 ， 它 允 
许 更 高 优先 级 的 数据 传输 。 带 外 数据 先行 传输 ， 即 使 传输 队列 已 经 有 数据 。TCP 支持 带 外 数 
据 , 但 是 UDP 不 支持 。 套 接 字 接 口 对 带 外 数据 的 支持 很 大 程度 上 受 TCP 带 外 数据 具体 实现 的 
影响 。 

TCP 将 带 外 数据 称 为 紧急 数据 《urgent data). TCP 仅 支 持 一 个 字 节 的 紧急 数据 ， 但 是 允许 紧 
急 数 据 在 普通 数据 传递 机 制 数据 流 之 外 传输 。 为 了 产生 紧急 数据 ， 可 以 在 3 个 sena 函数 中 的 任 
何 一 个 里 指定 MSG OOB 标志 。 如 果 带 MSG_00B 标志 发 送 的 字 节 数 超过 一 个 时 ， 最 后 一 个 字 节 将 
被 视 为 紧急 数据 字 节 。 

如 果 通 过 套 接 字 安排 了 信号 的 产生 ， 那 么 紧急 数据 被 接收 时 ， 会 发 送 SIGURG 信和 号。 在 3.14 
节 和 14.5.2 节 中 可 以 看 到 ， 在 fcntl 中 使 用 F_SETOWN 命令 来 设置 一 个 套 接 字 的 所 有 权 。 如 果 
fcntl 中 的 第 三 个 参数 为 正 值 ， 那 么 它 指定 的 就 是 进程 ID。 如 果 为 非 -1 的 负 值 ， 那 么 它 代 表 的 
就 是 进程 组 ID。 因 此 ， 可 以 通过 调用 以 下 函数 安排 进程 接收 套 接 字 的 信号 : 

fcntl(sockfd, F SETOWN, pid); 

F GETOWN 命令 可 以 用 来 获得 当前 套 接 字 所 有 权 。 对 于 F_SETOWN 命令 , 负 值 代表 进程 组 ID, 
正 值 代表 进程 ID。 因 此， 调用 


owner = fcntl(sockfd, F GETOWN, 0); 
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将 返回 owner, WR owner 为 正 值 ， 则 等 于 配置 为 接收 套 接 字 信和 号 的 进程 的 ID。 如 果 owner 为 
负 值 ， 其 绝对 值 为 接收 套 接 字 信 和 号 的 进程 组 的 ID. 

TCP 支持 紧急 标记 《〈urgent mark) 的 概念 ， 即 在 普通 数据 流 中 紧急 数据 所 在 的 位 置 。 如 果 采 
用 套 接 字 选 项 So OOBINLINE. 那么 可 以 在 普通 数据 中 接收 紧急 数据 。 为 帮助 判断 是 否 已 经 到 达 
紧急 标记 ， 可 以 使 用 函数 sockatmark. 


#include <sys/socket.h> 


int sockatmark (int sockfd) ; 





当下 一 个 要 读 取 的 字 节 在 紧急 标志 处 时 ，sockatmark 返回 1. 

当 带 外 数据 出 现在 套 接 字 读 取 队列 时 ，select MR CW 14.4.1 节 ) 会 返回 一 个 文件 描述 
符 并 且 有 一 个 待 处 理 的 异常 条 件 。 可 以 在 普通 数据 流 上 接收 紧急 数据 ， 也 可 以 在 其 中 一 个 
recv 函数 中 采用 MSG_OOB 标志 在 其 他 队列 数据 之 前 接收 紧急 数据 。TCP 队列 仅 用 一 个 字 节 的 
紧急 数据 。 如 果 在 接收 当前 的 紧急 数据 字 节 之 前 又 有 新 的 紧急 数据 到 来 ， 那 么 已 有 的 字 节 会 被 
EF. 


16.8” 非 阻塞 和 异步 I/O 


通常 ，recv 函数 没有 数据 可 用 时 会 阻塞 等 待 。 同 样 地 ， 当 套 接 字 输 出 队列 没有 足够 空间 来 
发 送 消息 时 ，send 函数 会 阻塞 。 在 套 接 字 非 阻塞 模式 下 ， 行 为 会 改变 。 在 这 种 情况 下 ， 这 些 孙 
数 不 会 阻塞 而 是 会 失败 , 将 errno 设置 为 EWOULDBLOCK 或 者 EAGAIN。 当 这 种 情况 发 生 时 ,可 
以 使 用 poll 或 select 来 判断 能 否 接收 或 者 传输 数据 。 

Single UNIX Specification 包含 通用 异步 VO 机 制 ( 见 14.5 节 ) 的 支持 。 套 接 字 机 制 有 其 自己 
的 处 理 异 步 VO 的 方式 , 但 是 这 在 Single UNIX Specification 中 没有 标准 化 。 一 些 文献 把 经 典 的 基 
于 套 接 字 的 异步 VO 机 制 称 为 “基于 信号 的 IO”， 区 别 于 Single UNIX Specification 中 的 通用 蜡 
2b VO 机 制 。 

在 基于 套 接 字 的 异步 VO 中 ， 当 从 套 接 字 中 读 取 数据 时 ， 或 者 当 套 接 字 写 队列 中 空间 变 得 可 
用 时 ， 可 以 安排 要 发 送 的 信号 SIGIO。 启 用 异步 VO 是 一 个 两 步骤 的 过 程 。 

COD 建立 套 接 字 所 有 权 ， 这 样 信号 可 以 被 传递 到 合适 的 进程 。 

(2) 通知 套 接 字 当 LO 操作 不 会 阻塞 时 发 信号 。 

可 以 使 用 3 种 方式 来 完成 第 一 个 步骤 。 

(D 在 fcnt1l 中 使 用 F_SETOWN 命令 。 

(2) 在 ioctl 中 使 用 FIOSETOWN 命令 。 

(3) 在 ioctl 中 使 用 SIOCSPGRP 命令 。 

要 完成 第 二 个 步骤 ， 有 两 个 选择 。 

(1) 在 fcntl 中 使 用 F_SETFL 命令 并 且 启 用 文件 标志 O_ASYNC. 

(2) Æ ioctl i FIOASYNC 命令 。 

虽然 有 多 种 选项 ， 但 它们 没有 得 到 普遍 支持 。 图 16-23 总 结 了 本 文 讨 论 的 平台 支持 这 些 选 项 
的 情况 。 
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机 制 


fcntl(fd, F SETOWN, pid) 
ioctl(fd, FIOSETOWN, pid) 
ioctl(fd, SIOCSPGRP, pid) 





16-23 ” 套 接 字 异 步 VO 管理 命令 
16.9 小结 


本 章 考察 了 IPC 机 制 ， 这些 机 制 允 许 进程 与 不 同 计算 机 上 的 以 及 同一 计算 机 上 的 其 他 进程 通 
信 。 我 们 讨论 了 套 接 字 端 点 如 何 命名 ， 在 连接 服务 器 时 ， 如 何 发 现 所 用 的 地 址 。 

我 们 给 出 了 采用 无 连接 的 〈 即 基于 数据 报 的 ) 套 接 字 和 面向 连接 的 套 接 字 的 客户 端 和 服务 器 
的 实例 ， 还 简要 讨论 了 异步 和 非 阻塞 的 套 接 字 WO， 以 及 用 于 管理 套 接 字 选 项 的 接口 。 

下 一 章 将 会 考察 一 些 高 级 IPC 主题 ， 包 括 在 同一 台 计 算 机 上 如 何 使 用 套 接 字 在 两 个 进程 之 间 
传送 文件 描述 符 。 


习题 


16.1 写 一 个 程序 判断 所 使 用 系统 的 字 节 序 。 

162 写 一 个 程序 ， 在 至 少 两 种 不 同 的 平台 上 打印 出 所 支持 套 接 字 的 stat 结构 成 员 ， 并 且 描 述 这 
些 结果 的 不 同 之 处 。 

16.3 图 16-17 的 程序 只 在 一 个 端点 上 提供 了 服务 。 修 改 这 个 程序 ， 同 时 支持 多 个 端点 (每 个 端点 
具有 一 个 不 同 的 地 址 ) 上 的 服务 。 | 

16.4 写 一 个 客户 端 程序 和 服务 端 程序 ， 返 回 指定 主机 上 当前 运行 的 进程 数量 。 

165 在 图 16-18 的 程序 中 ， 服 务 器 等 待 子 进程 执行 uptime， 子 进程 完成 后 退出 ， 服 务 器 才 接 受 
下 一 个 连接 请 求 。 重 新 设计 服务 器 ， 使 得 处 理 一 个 请 求 时 并 不 拖延 处 理 到 来 的 连接 请 求 。 

1666 写 两 个 库 例 程 : 一 个 在 套 接 字 上 人 允许 异步 VO 一 个 在 套 接 字 上 不 允许 异步 VO. 使 用 图 1623 
来 保证 函数 能 够 在 所 有 平台 上 运行 ， 并 且 支 持 尽 可 能 多 的 套 接 字 类 型 。 
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17.1 引言 


前 面 两 章 讨论 了 UNIX 系统 提供 的 各 种 PC， 其 中 包括 管道 和 套 接 字 。 本 章 介绍 一 种 高 级 
IPC— UNIX 域 套 接 字 机 制 , 并 说 明 它 的 应 用 方法 。 这 种 形式 的 IPC 可 以 在 同一 计算 机 系统 上 运 
行 的 两 个 进程 之 间 传 送 打开 文件 描述 符 。 服 务 进 程 可 以 使 它们 的 打开 文件 描述 符 与 指定 的 名 字 相 
关联 ， 同 一 系统 上 运行 的 客户 进程 可 以 使 用 这 些 名 字 与 服务 器 进程 汇聚 。 我 们 还 会 了 解 到 操作 系 
统 如 何 为 每 一 个 客户 进程 提供 一 个 独 用 的 IPC 通道 。 


17.2 UNIX 域 套 接 字 


UNIX 域 套 接 字 用 于 在 同一 台 计 算 机 上 运行 的 进程 之 间 的 通信 。 虽 然 因特网 域 套 接 字 可 用 于 
同一 目的 ， 但 UNIX 域 套 接 字 的 效率 更 高 。UNIX 域 套 接 字 仅仅 复制 数据 ， 它 们 并 不 执行 协议 处 
理 ， 不 需要 添加 或 删除 网 络 报 头 ， 无 需 计 算 校 验 和 ， 不 要 产生 顺序 号 ， 无 需 发 送 确 认 报 文 。 

UNIX 域 套 接 字 提 供 流 和 数据 报 两 种 接口 。UNIX 域 数 据 报 服务 是 可 靠 的 ， 既 不 会 丢失 报 文 
也 不 会 传递 出 错 。UNIX 域 套 接 字 就 像 是 套 接 字 和 管道 的 混合 。 可 以 使 用 它们 面向 网 络 的 域 套 接 
字 接 口 或 者 使 用 socketpair 函数 来 创建 一 对 无 命名 的 、 相 互 连 接 的 UNIX 域 套 接 字 。 





虽然 接口 足够 通用 ， 人 允许 socketpair 用 于 其 他 域 ， 但 一 般 来 说 操 用 户 进程 
作 系 统 仅 对 UNIX 域 提 供 支 持 。 

一 对 相互 连接 的 UNIX 域 套 接 字 可 以 起 到 全 双 工 管道 的 作用 : 两 端 对 
读 和 写 开 放 〈 见 图 17-1)。 我 们 将 其 称 为 fd 管道 (fd-pipe)， 以 便 与 普通 


的 半 双 工 管道 区 分 开 来 。 F] fane 
各 实例 : £d pipe 函数 Uu gp 
akp: £d pipe 函数 

17-2 展示 了 £d pipe 函数 ， 它 使 用 socketpair 消 数 来 创建 一 EI RM 


对 相互 连接 的 UNIX 域 流 套 接 字 。 


finclude "apue.h" 
#tinclude <sys/socket.h> 
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/* 
* Returns a full-duplex pipe (a UNIX domain socket) with 
* the two file descriptors returned in fd[0] and fd[1]. 
*/ 
int 
fd pipe(int fd[2]) 
{ 
return(socketpair(AF UNIX, SOCK STREAM, 0, fd)): 


) 
17-2 创建 一 个 全 双 工 管道 


| 某 些 基于 BSD 的 系统 使 用 UNIX 城 套 接 宇 来 实现 管道 。 但 当 调用 pipe n, 第 一 描述 符 的 写 
1 


p 


端 和 第 二 描述 符 的 读 端 都 是 关闭 的 。 为 了 得 到 全 双 工 管道 ， 必 须 直接 调用 socketpair. ü 


& 实例 : 借助 UNIX 域 套 接 宇 轮 询 XSI 消息 队列 


15.6.4 节 曾 经 提 到 XSI 消息 队列 的 使 用 存在 一 个 问题 ， 即 不 能 将 它们 和 poll 或 者 select 
一 起 使 用 ， 这 是 因为 它们 不 能 关联 到 文件 描述 符 。 然 而 ， 套 接 字 是 和 文件 描述 符 相 关联 的 ， 消 息 
到 达 时 ， 可 以 用 套 接 字 来 通知 。 对 每 个 消息 队列 使 用 一 个 线程 。 每 个 线程 都 会 在 msgrcv 调用 中 
阻塞 。 当 消息 到 达 时 ， 线 程 会 把 它 写 入 一 个 UNIX 域 套 接 字 的 一 端 。 当 poll 指示 套 接 字 可 以 读 
取 数 据 时 ， 应 用 程序 会 使 用 这 个 套 接 字 的 另外 一 端 来 接收 这 个 消息 。 

图 17-3 中 的 程序 说 明了 这 个 技术 。main 函数 中 创建 了 一 些 消息 队列 和 UNIX 域 套 接 字 ， 并 
为 每 个 消息 队列 开启 了 一 个 新 线程 。 然 后 它 在 一 个 无 限 循环 中 用 poll 来 轮 询 选 择 一 个 套 接 字 端 
点 。 当 某 个 套 接 字 可 读 时 ， 程 序 可 以 从 套 接 字 中 读 取 数 据 并 把 消息 打印 到 标准 输出 上 。 
#include "apue.h" 
#include <poll.h> 
#include «pthread.h» 


#include <sys/msg.h> 
#include <sys/socket.h> 


#define NQ 3 /* number of queues */ 
#define MAXMSZ 512 /* maximum message size */ 
#define KEY 0x123 /* key for first message queue */ 


struct threadinfo { 
int qid; 
int fd; 

}; 


struct mymesg | 

long mtype; 

char mtext[MAXMSZ]; 
hi 


void * 

helper {void *arq) 

{ 
int n; 
struct mymesg m; 





Struct threadinfo 


fortes) 4 
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*tip = arg? 


memset (ám, 0, sizeofím)); 

if (tn = msgrcv(tip-»qid, &m, MAXMSZ, 0, MSG NOERROR)) < 0) 
err sys("msgrcv error"); 

if (write(tip->fd, m.mtext, n) < 0) 
err sys("write error"); 


int 

struct pollfd 
struct threadinfo 
pthread t 

char 


i, n, err}; 
fd[2]; 
qid[NQ]; 
pfd[NQ]; 
ti[NQ]; 
tid[NQ]; 
buf [MAXMSZ}; 


for (i = 0; i < NQ; i++) { 
if ((qid[i] = msgget((KEY*i), IPC CREAT|0666)) < 0) 
err sys('"msgget error"); 


printf("queue ID %d is $dMn", i, qidl[il): 


if (socketpair(AF UNIX, SOCK DGRAM, 0, fd) < 0) 
err sys("socketpair error"); 


pfd[i].fd = fd[0] 


» 
[4 


pfd[i)].events = POLLIN; 
ti[i].qid = qid[i]; 


ti[i].fd = fd[1]; 


if ((err = pthread create(&tid[i], NULL, helper, &tifi])) != 0) 


err_exit(err, 


for (77) { 


“pthread create error"); 


if (poll(pfd, NQ, -1) < 0) 
err sys("poll error"); 
for (i = 0; i < NQ; i++) { 
if (pfd[i].revents & POLLIN) { 


if ((n = 


read(pfd[i].fd, buf, sizeof(buf))) < 0) 


err sys("read error"); 


buf(n] = 


0; 


printf ("queue id $d, message %s\n", qgid[i], buf); 


exit (0); 


图 17-3 ”使 用 UNIX 域 套 接 字 轮 询 XSI 消息 队列 
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注意 ， 我 们 使 用 的 是 数据 报 (SOCK_DGRAM) 套 接 字 而 不 是 流 套 接 字 。 这 样 做 可 以 保持 消息 
边界 ， 以 保证 从 套 接 字 里 一 次 只 读 取 一 条 消息 。 
这 种 技术 可 以 〔 非 直接 地 ) 在 消息 队列 中 运用 poll 或 者 select。 只 要 为 每 个 队列 分 配 一 
个 线程 的 开销 以 及 每 个 消息 额外 复制 两 次 〈 一 次 写 入 套 接 字 ， 另 一 次 从 套 接 字 里 读 取出 来 ) 的 开 
销 是 可 接受 的 ， 这 种 技术 就 会 使 XSI 消息 队列 的 使 用 更 加 容易 。 
使 用 图 17-4 中 所 示 的 程序 给 图 17-3 中 所 示 的 测试 程序 发 送 消 息 。 


#include "apue.h" 
#include <sys/msg.h> 


#define MAXMSZ 512 


struct mymesg { 

long mtype; 

char mtext (MAXMSZ]; 
}; 


int 
main(int argc, char *argv[]) 
i 

key t key; 

long gid; 

size t nbytes; 

struct mymesg m; 


if (argc != 3) { 
fprintf(stderr, "usage: sendmsg KEY messageMn"); 
exit(1); 
} 
key = strtol(argv[1], NULL, 0); 
if ((qid = msgget(key, 0)) < 0) 
err sys("can't open queue key $s", argv[1i]): 
memset (ám, O0, sizeofím)); 
strncpy(m.mtext, argv[2], MAXMSZ-1); 
nbytes = strlen(m.mtext); 
m.mtype = 1; 
if (msgsnd(qid, &m, nbytes, 0) < 0) 
err sys("can't send message"); 
exit (0); 


图 17-4 给 XSI 消息 队列 发 送 消息 
这 个 程序 需要 两 个 参数 :消息 队列 关联 的 键 值 以 及 一 个 包含 消息 主体 的 字符 串 。 发 送 消 息 到 
服务 器 端 时 ， 它 会 打印 如 下 信息 : 


$ ./pollmag & 在 后 台 运 行 服务 器 

[1] 12814 

$ queue ID 0 is 196608 

queue ID 1 is 196609 

queue ID 2 is 196610 

$ ./sendmag 0x123 "hello, world" 给 第 一 个 队列 发 送 一 条 消息 
queue id 196608, message hello, world 

$ ./sendmsg 0x124 "just a test" 给 第 二 个 队列 发 送 一 条 消息 
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queue id 196609, message just a test 
$ ./sendmsg 0x125 "bye" 给 第 三 个 队列 发 送 一 条 消息 
queue id 196610, message bye m 


命名 UNIX 域 套 接 字 


虽然 socketpair 函数 能 创建 一 对 相互 连接 的 套 接 字 ， 但 是 每 一 个 套 接 字 都 没有 名 字 。 这 
意味 着 无 关 进 程 不 能 使 用 它们 。 

在 16.3.4 节 中 学 习 了 如 何 将 一 个 地 址 绑 定 到 一 个 因特网 域 套 接 字 上 。 恰 如 因特网 域 套 接 字 一 
样 ， 可 以 命名 UNIX 域 套 接 字 ， 并 可 将 其 用 于 告示 服务 。 但 是 要 注意 ，UNIX 域 套 接 字 使 用 的 地 
址 格式 不 同 于 因特网 域 套 接 字 。 

回忆 16.3 节 ， 套 接 字 地 址 格式 会 随 实 现 而 变 。UNIX 域 套 接 字 的 地 址 由 sockaddr un 结构 
XR. f£ Linux 3.2.0 和 Solaris 10 中 ，sockaddr_un 结构 在 头 文件 <sys /un.h> 中 的 定义 
如 下 : 


struct sockaddr un { 
sa family t sun family: /* AF UNIX */ 
char sun path[108]; /* pathname */ 


但 是 在 FreeBSD 8.0 和 Mac OS X 10.6.8 '}, sockaddr un 结构 的 定义 如 下 : 


struct sockaddr un { 


unsigned char sun len; /* sockaddr length */ 
sa family t sun, family; /* AF UNIX */ 
char sun path[104]; /* pathname */ 


un 
sockaddr un 结构 的 sun path 成 员 包含 一 个 路 径 名 。 当 我 们 将 一 个 地 址 绑 定 到 一 个 UNIX 
域 套 接 字 时 ， 系 统 会 用 该 路 径 名 创建 一 个 S_IFSOCK 类 型 的 文件 。 

该 文件 仅 用 于 向 客户 进程 告示 套 接 字 名 字 。 该 文件 无 法 打开 ， 也 不 能 由 应 用 程序 用 于 
通信 。 

如 果 我 们 试图 绑 定 同 一 地 址 时 ， 该 文件 已 经 存在 ， 那 么 Dina 请 求 会 失败 。 当 关闭 套 接 字 时 ， 
并 不 自动 删除 该 文件 ， 所 以 必须 确保 在 应 用 程序 退出 前 ， 对 该 文件 执行 解除 链接 操作 。 


^a PI 

图 17-5 所 示 的 程序 是 一 个 将 地 址 绑 定 到 UNIX 域 套 接 字 的 例子 。 

运行 此 程序 时 ，bind 请 求 成 功 执行 。 但 是 ， 若 第 二 次 运行 该 程序 ， 则 出 错 返回 ， 其 原因 是 
该 文件 已 经 存在 。 在 删除 该 文件 之 前 ， 该 程序 不 会 再 成 功 运行 。 


$ ./a.out 运行 该 程序 

UNIX domain socket bound 

$ ls -1 foo.socket 查看 套 接 字 文件 
srwxrw-xr-x 1 sar O May 18 00:44 foo.socket 

$ ./a.out 试图 再 次 运行 该 程序 
bind failed: Address already in use 

$ rm foo.socket 删除 该 套 接 字 文 件 
$ ./a.out 第 三 次 运行 该 程序 


UNIX domain socket bound HERH 
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#include "apue.h" 
#include <sys/socket.h> 
#include <sys/un.h> 


int 
main (void) 
{ 
int fd, size; 
struct sockaddr un un; 


un.sun family - AF UNIX; 
strcpy(un.sun path, "foo.socket"); 
if ((fd = socket(AF UNIX, SOCK STREAM, 0)) < 0) 
err sys("socket failed"); 
size = offsetof(struct sockaddr un, sun path) + strlen(un.sun path); 
if (bind(fd, (struct sockaddr *)éun, size) < 0) 
err sys("bind failed"); 
printf("UNIX domain socket bound\n"); 
exit (0); 


图 17-5 ”将 地 址 绑 定 到 UNIX 域 套 接 字 
确定 绑 定 地 址 长 度 的 方法 是 ， 先 计算 sun path MAZE sockaddr_un 结构 中 的 偏 移 量 ， 然 
后 将 结果 与 路 径 名 长 度 〈 不 包括 终止 null 字符 ) 相 加 。 因 为 sockaddr un 结构 中 sun path 之 
前 的 成 员 与 实现 相关 ， 所 以 我 们 使 用 <stddef .h> 头 文件 (包括 在 apue.h 中 ) 中 的 offsetof 
宏 计 算 sun path 成 员 从 结构 开始 处 的 偏 移 量 。 如 果 查 看 <stadef .h>， 则 可 见 到 类 似 于 下 列 形 
式 的 定义 : 


#define offsetof (TYPE, MEMBER) ((int)&((TYPE *)0) -»MEMBER) 


假定 该 结构 从 地 址 0 开始 ， 此 表达 式 求 得 成 员 起 始 地 址 的 整 型 值 。 s 
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服务 器 进程 可 以 使 用 标准 bind. listen 和 accept 函数 ,为 客户 进程 安排 一 个 唯一 UNIX 
域 连接 。 客 户 进程 使 用 connect 与 服务 器 进程 联系 。 在 服务 器 进程 接受 了 connect 请 求 后 , 在 
服务 器 进程 和 客户 进程 之 间 就 存在 了 唯一 连接 。 这 种 风格 的 操作 与 我 们 在 图 16-16 和 图 16-17 中 
所 示 的 对 因特网 域 套 接 字 的 操作 相同 。 

17-6 展示 了 客户 进程 和 服务 器 进程 存在 连接 之 前 二 者 的 情形 。 RS IE CNR SRE 
到 sockaddr un 的 地 址 并 监听 新 的 连接 请 求 。 图 17-7 展示 了 在 服务 器 端 接 受 客户 端 连接 请 求 后 ， 
客户 端 和 服务 器 端 之 间 建 立 的 唯一 的 连接 。 

现在 ， 我 们 将 开发 3 个 函数 ， 使 用 这 些 函 数 可 以 在 运行 于 同一 台 计 算 机 上 的 两 个 无 关 进 程 之 
间 创 建 唯 一 连接 。 这 些 函 数 模仿 了 在 16.4 节 中 讨论 过 的 面向 连接 的 套 接 字 函 数 。 这 里 ， 我 们 将 
UNIX 域 套 接 字 应 用 于 底层 通信 机 制 。 
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服务 器 进程 客户 进程 






服务 器 进程 客户 进程 
mE EE sun path 
nope 
17-6 connect 之 前 的 客户 端 图 17-7 connect 之 后 的 客户 端 
套 接 字 和 服务 器 端 套 接 字 套 接 字 和 服务 器 端 套 接 字 


#include "apue.h" 
int serv listen(const char *name); 
BEA: 若 成 功 ， 返 回 要 监听 的 文件 描述 符 ; 若 出 错 ， 返 回 负 值 


int serv accept(int listenfd, uid t *uidptr); 


返回 值 : BR, BAAR, 若 出 错 ， 返 回 负 值 


int cli, conn(const char *name); 





服务 器 进程 可 以 调用 serv listen 函数 ( 见 图 17-8) 声明 本 全 于 于 (文件 
系统 中 的 某 个 路 径 名 ) 上 监听 客户 进程 的 连接 请 求 。 当 客户 进程 想 要 连接 至 服务 器 进程 时 ， 它 们 将 
使 用 该 名 字 。serv_listen 函数 的 返回 值 是 用 于 接收 客户 进程 连接 请 求 的 服务 器 UNIX 域 套 接 字 。 

服务 器 进程 可 以 使 用 serv accept AR (A 17-9) 等 待 客户 进程 连接 请 求 的 到 达 。 当 一 
个 请 求 到 达 时 ， 系 统 自动 创建 一 个 新 的 UNIX 域 套 接 字 ， 并 将 它 与 客户 端 套 接 字 连 接 ， 最 后 将 这 
个 新 套 接 字 返回 给 服务 器 。 此 外 ， 客 户 进程 的 有 效用 户 ID 存放 在 uidptr 指向 的 存储 区 中 。 

客户 进程 调用 c1i conn 函数 ( 见 图 17-100 连接 至 服务 器 进程 。 客 户 进程 指定 的 name 参数 
必须 与 服务 器 进程 调用 serv listen 函数 时 所 用 的 名 字 相 同 。 函 数 返 回 时 ， 客 户 进程 得 到 接连 
至 服务 器 进程 的 文件 描述 符 。 

图 17-8 给 出 了 serv listen Pm. 
#include "apue.h" 
finclude «sys/socket.h» 


#include <sys/un.h> 
#include <errno.h> 


#define QLEN 10 


/* 

* Create a server endpoint of a connection. 
* Returns fd if all OK, «0 on error. 

Xy 

int 

serv listen(const char *name) 

[ 


int fd, len, err, rval; 
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struct sockaddr un un; 


if (strlen(name) >= sizeof(un.sun path)) { 
errno = ENAMETOOLONG; 
return(-1); 

} 


/* create a UNIX domain stream socket */ 
if ((fd = socket(AF UNIX, SOCK STREAM, 0)) < 0} 
return (-2); 


unlink (name); /* in case it already exists */ 


/* fill in socket address structure */ 

memset (&un, 0, sizeof(un)); 

un.sun_family = AF_UNIX; 

strcpy(un.sun path, name); 

len = offsetof (struct sockaddr un, sun path) + strlen(name) ; 


/* bind the name to the descriptor */ 

if (bind(fd, (struct sockaddr *)&un, len) < 0) { 
rval = -3; 
goto errout; 


} 


if (listen(fd, QLEN) < 0) { /* tell kernel we're a server */ 
rval = -4; 
goto errout; 


) 
return (fd); 


errout: 
err = errno; 
close (fd); 
errno = err; 
return (rval); 


17-8 serv listen MR 


首先 ， 调 用 socket 创建 一 个 UNIX 域 套 接 字 。 然 后 将 欲 赋 给 套 接 字 的 众所周知 的 路 径 名 填 
入 sockaddr un 结构 。 该 结构 是 调用 bind 的 参数 。 注意 ,不 需要 设置 某 些 平台 提供 的 sun len 
字段 ， 因 为 操作 系统 会 用 传送 给 bind 函数 的 地 址 长 度 设置 该 字段 。 

最 后 ， 调 用 listen 函数 ( 见 16.4 节 ) 来 通知 内 核 该 进程 将 作为 服务 器 进程 等 待 客户 进程 的 
连接 请 求 。 当 收 到 一 个 客户 进程 的 连接 请 求 后 , 服务 器 进程 调用 serv accept 函数 ( 见 图 17-9). 
#include "apue.h" 
finclude <sys/socket.h> 
#include <sys/un.h> 


#include <time.h> 
#include <errno.h> 





#define STALE 30 /* client's name can't be older than this (sec) */ 


/* 
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* Wait for a client connection to arrive, and accept it. 
* We also obtain the client's user ID from the pathname 
* that it must bind before calling us. 

* Returns new fd if all OK, «0 on error 

*/ 

int 

serv accept(int listenfd, uid t *uidptr) 


{ 


int clifd, err, rval; 
socklen_t len; 

time_t staletime; 

struct sockaddr_un un; 

struct stat statbuf; 

char *name; 


/* allocate enough space for longest name plus terminating null */ 
if ((name = malloc(sizeof(un.sun_path) + 1)) == NULL) 
return(-1); 
len = sizeof (un); 
if ((clifd = accept(listenfd, (struct sockaddr *)&un, &len)) < 0} { 
free (name); 
return (-2); /* often errno=EINTR, if signal caught */ 


/* obtain the client's uid from its calling address */ 
len -= offsetof (struct sockaddr un, sun path); /* len of pathname */ 
memcpy (name, un.sun_path, len); 
name[len] = 0; /* null terminate */ 
if (stat(name, &statbuf) < 0) { 
rval - -3; 
goto errout; 


#ifdef S ISSOCK /* not defined for SVR4 */ 
if (S ISSOCK(statbuf.st mode) == 0) I 
rval = -4; /* not a socket */ 


goto errout; 


] 
fendif 


if ((statbuf.st mode & (S IRWXG | S IRWXO)) || 
(statbuf.st mode & S IRWXU) !- S IRWXU) | 
rval = -5; /* is not rwx------ w 
goto errout; 


staletime - time(NULL) - STALE; 
if (statbuf.st atime « staletime || 
statbuf.st_ctime < staletime || 
statbuf.st mtime < staletime) { 
rval = -6; /* i-node is too old */ 
goto errout; 


if (uidptr != NULL) 
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*uidptr = statbuf.st uid; /* return uid of caller */ 
unlink (name); /* we're done with pathname now */ 
free (name); 
return (clifd); 


errout: 
err = errno; 
close (clifd); 
free (name) ; 
errno = err; 
return (rval); 


17-9 serv accept M% 


服务 器 进程 在 调用 serv accept 中 阻塞 ， 等 待 一 个 客户 进程 调用 cli conn. M accept 
返回 时 , 返回 值 是 连接 到 客户 进程 的 革新 的 描述 符 。 另 外 ,accept 函数 也 经 由 其 第 二 个 参数 48 
向 sockaddr un 结构 的 指针 ) 返回 客户 进程 赋 给 其 套 接 字 的 路 径 名 (包含 客户 进程 DHA). 
接着 ， 程 序 复制 这 个 路 径 名 ， 并 确保 它 是 以 null 终止 的 《如 果 路 征 名 占用 了 sockaddr un 结构 
里 的 sun path 成 员 所 有 的 可 用 空间 ， 那 就 没有 空间 存放 终止 null 字符 )。 然 后 ， 调 用 stat R 
数 验证 ; 该 路 径 名 确实 是 一 个 套 接 字 ; 其 权限 仅 允 许 用 户 读 、 用 户 写 以 及 用 户 执行 。 还 要 验证 与 
套 接 字 相 关联 的 3 个 时 间 参 数 不 比 当前 时 间 早 30 秒 。( 回 忆 6.10 节 ，time 函数 返回 当前 时 间 和 
日 期 ， 用 公元 1970 年 1 月 1 日 00:00:00 以 来 经 过 的 秒 数 表 示 。) 

如 若 通过 了 所 有 这 些 检验 , 则 可 认为 客户 进程 的 身份 (其 有 效用 户 ID) 是 该 套 接 字 的 所 有 者 。 
虽然 这 种 检验 并 不 完善 ， 但 这 是 对 当前 系统 所 能 做 到 的 最 佳 方案 。( 如 若 内 核能 通过 accept 的 
参数 返回 有 效用 户 ID， 则 会 更 好 一 些 。) 

客户 进程 调用 cli conn 函数 CILE 17-100 对 连 到 服务 器 进程 的 连接 进行 初始 化 。 
#include "apue.h" 
finclude «sys/socket.h» 


#include <sys/un.h> 
#include <errno.h> 


fdefine CLI PATH "/var/tmp/" 
#define CLI_PERM S_IRWXU /* rwx for user only */ 
/* 


* Create a client endpoint and connect to a server. 
* Returns fd if all OK, <0 on error. 

il d 

int 

cli conní(const char *name) 


{ 


int fd, len, err, rval; 
struct sockaddr_un un, sun; 
int do_unlink = 0; 


if (strlen(name) >= sizeof(un.sun_path)) [| 
errno = ENAMETOOLONG; 
return(-1); 
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/* create a UNIX domain stream socket */ 
if ((fd = socket(AF UNIX, SOCK STREAM, 0)) < 0) 
returní-1); 


/* fill socket address structure with our address */ 

memset(&un, 0, sizeof(un)); 

un.sun family - AF UNIX; 

sprintf(un.sun path, "$s$051d", CLI PATH, (long) getpid()); 

len = offsetof (struct sockaddr un, sun path) + strlen(un.sun path); 


unlink(un.sun path); /* in case it already exists */ 
if (bind(fd, (struct sockaddr *)&un, len) < 0) { 
rval = -2; 


goto errout; 
) 
if (chmod(un.sun path, CLI PERM) < O) { 
rval = -3; 
do unlink = 1; 
goto errout; 


} 


/* fill socket address structure with server's address */ 
memset(&sun, 0, sizeof(sun)); 
sun.sun_family = AF_UNIX; 
strcpy(sun.sun path, name); 
len = offsetof(struct sockaddr un, sun path) + strlen(name); 
if (connect(fd, (struct sockaddr *)&sun, len) < 0) { 
rval - -4; 
do unlink - 1; 
goto errout; 
] 
return(fd); 


errout: 
err = errno; 
close(fd): 
if (do unlink) 
unlink (un.sun_path) ; 
errno = err; 
return (rval); 





17-10 cli conn 函数 

调用 socket 函数 创建 UNIX 域 套 接 字 的 客户 进程 端 ， 然 后 用 客户 进程 专 有 的 名 字 填 入 
sockaddr_un 结构 。 

此 例 中 没 让 系统 选择 默认 地 址 ， 其 原因 是 ， 如 果 这 样 处 理 ， 服 务 器 进程 将 不 能 区 分 各 个 客户 
进程 (如 果 不 为 UNIX 域 套 接 字 显 式 地 绑 定名 字 ， 内 核 会 代表 我 们 隐 式 地 绑 定 一 个 地 址 且 不 会 在 
文件 系统 创建 文件 来 表示 这 个 套 接 字 )。 于 是 ， 我 们 绑 定 自己 的 地 址 ， 但 在 开发 使 用 套 接 字 的 客 
户 端 程序 时 通常 并 不 采用 这 一 步骤 。 

绑 定 的 路 径 名 的 最 后 5 个 字符 来 自 客户 进程 DD。 仅 在 该 路 径 名 已 存在 时 调用 unlink. Ra, 
调用 bind 将 名 字 赋 给 客户 进程 套 接 字 。 这 在 文件 系统 中 创建 了 一 个 套 接 字 文件 ， 所 用 的 名 字 与 
被 绑 定 的 路 径 名 一 样 。 接 着 ， 调 用 chmod 关闭 除 用 户 读 、 用 户 写 以 及 用 户 执行 以 外 的 其 他 权限 。 
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在 serv accept 中 ， 服 务 器 进程 检验 这 些 权限 以 及 套 接 字 用 户 ID 以 验证 客户 进程 的 身份 。 
然后 ， 必 须 填充 男 一 个 sockaddr un 结构 ， 这 次 用 的 是 服务 进程 众所周知 的 路 径 名 。 最 后 ， 
调用 connect 函数 初始 化 与 服务 进程 的 连接 。 


17.4 ”传送 文件 描述 符 


在 两 个 进程 之 闻 传 送 打开 文件 描述 符 的 技术 是 非常 有 用 的 。 因 此 可 以 对 客户 进程 -服务 器 进程 
应 用 进行 不 同 的 设计 。 它 使 一 个 进程 〈 通 常 是 服务 器 进程 ) 能 够 处 理 打开 一 个 文件 所 要 做 的 一 切 
操作 〈 包 括 将 网 络 名 翻译 为 网 络 地 址 、 拨 号 调制 解 调 器 、 协 商 文 件 锁 等 ) 以 及 向 调用 进程 送 回 一 
个 描述 符 ， 该 描述 符 可 被 用 于 以 后 的 所 有 VO 函数 。 涉 及 打开 文件 或 设备 的 所 有 细节 对 客户 进程 
而 言 都 是 透明 的 。 

王 面 进一步 说 明 从 一 个 进程 向 另 一 个 进程 “传送 一 个 打开 文件 描述 符 ” 的 含义 。 回 忆 图 3-8, 
其 中 显示 了 两 个 进程 ， 它 们 打开 了 同一 文件 。 虽 然 它 们 共享 同一 个 v 节点 ， 但 每 个 进程 都 有 它 自 
己 的 文件 表 项 。 

当 一 个 进程 向 另 一 个 进程 传送 一 个 打开 文件 描述 符 时 ， 我 们 想 让 发 送 进 程 和 接收 进程 共享 同 
一 文件 表 项 。 图 17-11 显示 了 所 期 望 的 安排 。 

进程 表 项 


文件 表 


文件 状态 标志 
当前 文件 偏 移 量 





17-1 ”从 顶部 进程 传送 一 个 打开 文件 至 底部 进程 
在 技术 上 ， 我 们 是 将 指向 一 个 打开 文件 表 项 的 指针 从 一 个 进程 发 送 到 另外 一 个 进程 。 该 指针 
被 分 配 存放 在 接收 进程 的 第 一 个 可 用 描述 符 项 中 。( 注 意 ， 不 要 造成 错觉 ， 以 为 发 送 进程 和 接收 
进程 中 的 描述 符 编号 是 相同 的 ， 它 们 通常 是 不 同 的 。》 两 个 进程 共享 同一 个 打开 文件 表 ， 这 与 fork 
之 后 的 父 进程 和 子 进程 共享 打开 文件 表 的 情况 完全 相同 〈 见 图 8-2). 
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当 发 送 进程 将 描述 符 传送 给 接收 进程 后 ， 通 常会 关闭 该 描述 符 。 发 送 进 程 关闭 该 描述 符 并 不 会 真 的 
关闭 该 文件 或 设备 ， 其 原因 是 该 描述 符 仍 被 视 为 由 接收 进程 打开 即使 接收 进程 尚未 接收 到 该 描述 符 )。 
下 面 定义 本 章 用 以 发 送 和 接收 文件 描述 符 的 3 个 函数 。 本 节 后 面 会 给 出 这 3 个 函数 的 代码 。 


#include "apue.h" 


int send fd(int fd, int fd to send); 


int send err(int fd, int status, const char *errmsg); 
两 个 函数 的 返回 值 ， 车 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 
int recv fd(int fd, ssize t (*userfunc) (int, const void *, size_t)); 
返回 值 : 若 成 功 ， 返 回 文件 描述 符 ， 考 出 错 ， 返 回 负 值 
当 一 个 进程 (通常 是 服务 器 进程 ) 想 将 一 个 描述 符 传送 给 另 一 个 进程 时 ， 可 以 调用 send fd 
或 send_err。 等 待 接收 摘 述 符 的 进程 〈 客 户 进程 ) 调用 recv fd. 
send fd 使 用 fd 代表 的 UNIX 域 套 接 字 发 送 描 述 符 应 to send. send err 使 用 fd 发 送 
errmsg 以 及 后 随 的 status 77. status 的 值 应 在 -1 一 -255。 
客户 进程 调用 recv_fd 接收 描述 符 。 如 果 一 切 正 常 〈 发 送 者 调用 了 send_ftd)， 则 函数 返回 
值 为 非 负 描 述 符 。 否 则 ， 返 回 值 是 由 send err 发 送 的 status (-1~-255 的 一 个 负 值 )。 另 外 ， 如 
果 服 务 器 进程 发 送 了 一 条 出 错 消息 ， 则 客户 进程 调用 它 自 己 的 userfunc 函数 处 理 该 消息 。userfunc 
的 第 一 个 参数 是 常量 STDERR_FILENO， 然 后 是 指向 出 错 消 息 的 指针 及 其 长 度 。wserfiunc 函数 的 
返回 值 是 已 写 的 字 节 数 或 负 的 出 错 编号 值 。 客 户 进程 常 将 普通 的 write BEBE userfunc. 
我 们 实现 用 于 这 3 个 函数 的 我 们 自己 制定 的 协议 。 为 发 送 一 个 描述 符 ，send_fd 先 发 送 2 F 
节 0， 然 后 是 实际 描述 符 。 为 了 发 送 一 条 出 错 消息 ，send_err 发 送 errmsg, REE 1 字 节 0， 
最 后 是 status 字 节 的 绝对 值 (1~255)。recv_fd 函数 读 取 套 接 字 中 所 有 字 节 直至 遇 到 null 字符 。 
null 字符 之 前 的 所 有 字符 都 传送 给 调用 者 的 userfunc. recv_fd 读 取 的 下 一 个 字 节 是 状态 ( status) 
字 节 。 若 状态 字 节 为 0， 则 表示 一 个 描述 符 已 传送 过 来 ， 否 则 表示 没有 描述 符 可 接收 。 
send err 函数 在 将 出 错 消息 写 到 套 接 字 后 ， 即 调用 send fd 函数 ， 如 图 17-12 所 示 。 


#include "apue.h" 





/* 

* Used when we had planned to send an fd using send fd(), 

* but encountered an error instead. We send the error back 
* using the send fd()/recv fd() protocol. 

*/ 

int 

send err(int fd, int errcode, const char *msg) 

( 


int n; 
if ((n = strlen(msg)) > 0) 
if (writen(fd, msg, n) != n) /* send the error message */ 


returní-1); 


if (errcode >= 0) 
errcode = -1; /* must be negative */ 


if (send fd(fd, errcode) « 0) 
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returní-1); 


return(í0); 


17-12. send err 函数 
为 了 用 UNIX 域 套 接 字 交换 文件 描述 符 ， 调 用 sendmsg(2) 和 recvmsgQ)ERA (AL 16.5 节 )。 
这 两 个 函数 的 参数 中 都 有 一 个 指向 msghdr 结构 的 指针 ， 该 结构 包含 了 所 有 关于 要 发 送 或 要 接收 
的 消息 的 信息 。 该 结构 的 定义 大 致 如 下 : 


struct msghdr { 


void *msg name; /* optional address */ 

socklen t msg namelen; /* address size in bytes */ 
struct iovec *msg iov; /* array of I/O buffers */ 

int msg iovlen; /* number of elements in array */ 
void *msg control; /* ancillary data */ 

Socklen t msg controllen; /* number of ancillary bytes */ 
int msg flags; /* flags for received message */ 


b 
前 两 个 元 素 通常 用 于 在 网 络 连接 上 发 送 数据 报 ， 其 中 目的 地 址 可 以 由 每 个 数据 报 指定 。 接 下 
来 的 两 个 元 素 使 我 们 可 以 指定 一 个 由 多 个 缓冲 区 构成 的 数组 《散布 读 和 聚集 写 )， 这 与 对 readv 
füwritev AM ( 见 14.6 节 ) 的 说 明 一 样 。 msg_flags 字段 包含 了 描述 接收 到 的 消息 的 标志 ， 
16-15 总 结 了 这 些 标 志 。 
两 个 元 素 处 理 控制 信息 的 传送 和 接收 。msg_control 字段 指向 cmsghdr GEB Bh) 4 
构 ，msg_controllen 字段 包含 控制 信息 的 字 节 数 。 


struct cmsghdr f 


socklen t cmsg_len; /* data byte count, including header */ 
int cmsg level; /* originating protocol */ 
int cmsg type; /* protocol-specific type */ 


/* followed by the actual control message data */ 
H 


为 了 发 送 文件 描述 符 ， 将 cmsg len 设置 为 cmsghdr 结构 的 长 度 加 一 个 整 型 的 长 度 〈 描 述 
符 的 长 度 )，cmg_level 字段 设置 为 SOL_SOCKET，cmsg_type 字段 设置 为 SCM_RIGHTS， 用 
以 表明 在 传送 访问 权 。(SCM 是 Socket-level Control Message 的 缩写 ， 即 套 接 字 级 控制 消息 。) uj 
问 权 仅 能 通过 UNIX 域 套 接 字 传送 。 描 述 符 紧 随 cmsg_type 字段 之 后 存储 ， 用 CMSG DATAE 
获得 该 整 型 量 的 指针 。 

在 此 定义 3 个 宏 ， 用 于 访问 控制 数据 ， 一 个 宏 用 于 帮助 计算 cmsg_len 所 使 用 的 值 。 

#include <sys/socket.h> 
unsigned char *CMSG DATA(struct cmsghdr *cp): 
返回 值 : 返回 一 个 指针 ， 指 向 与 cmsghdr 结构 相关 联 的 数据 


struct cmsghdr *CMSG FIRSTHDR(struct msghdr *mp); 


返回 值 ， 返回 一 个 指针 ， 指 向 与 msghdr 结构 相关 联 的 第 一 个 cmsghdr 结构 ; 
若 无 这 样 的 结构 ， 返 回 NULL 


struct cmsghdr *CMSG NXTHDR(struct msghdr *mp, 
struct cmsghdr *cp); 
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返回 值 : 返回 一 个 指针 , 指向 与 msghdr 结构 相关 联 的 下 一 个 cmsghdr 
结构 ， 该 msghdr 结构 给 出 了 当前 的 omsghdr 结构 ， 基 当前 


emsghdr 结构 已 是 最 后 一 个 ， 返 回 NULL 


unsigned int CMSG LEN(unsigned int nbytes}; 





Single UNIX Specification 定义 了 前 3 个 宏 ， 但 没有 定义 CMSG LEN, 


CMSG LEN 宏 返 回 存储 nbytes 长 的 数据 对 象 所 需 的 字 节 数 ， 它 先 将 nbytes 加 上 cmsghdr £i 
构 的 长 度 ， 然 后 按 处 理 器 体系 结构 的 对 齐 要 求 进行 调整 ， 最 后 青 向 上 取 整 。 

17-13 中 的 程序 是 UNIX 域 套 接 字 的 send fd 函数 ， 它 通过 UNIX 域 套 接 字 传递 文件 描述 
ff. sendmsg 调用 被 用 来 传送 协议 数据 (包括 null 字 节 和 状态 字 节 ) 以 及 描述 符 。 


#include "apue.h" 
#include <sys/socket.h> 


/* size of control buffer to send/recv one file descriptor */ 
#define CONTROLLEN CMSG_LEN (sizeof (int) } 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 
* Pass a file descriptor to another process. 
* If fd«0, then -fd is sent back instead as the error status. 
*/f 
int 
send fd(int fd, int fd to send) 
{ 
struct iovec  iov[1]; 
struct msghdr msg; 


char bu£[2]:; /* send fd()/recv fd() 2-byte protocol */ 
iov[(0].iov base = buf; 

iov[0].iov len = 2; 

msg.msg_iov = iov; 

msg.msg iovlen = 1; 

msg.msg name = NULL; 

msg.msg namelen  - O0; 


if (fd to send « 0) ( 


msg.msg control = NULL; 
msg.msg controllen - 0; 
buf[1] = -fd to send; ./* nonzero status means error */ 


if {buf[(1] == 0) 
buf(1] = 1; /* -256, etc. would screw up protocol */ 
} else { 
if {cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 
return(-1); 
emptr->cmsg_level 


SOL_SOCKET; 


cmptr-»cmsg type = SCM RIGHTS; 
cmptr-»cmsg len = CONTROLLEN; 
msg.msg control = cmptr; 


msg.msg_controllen = CONTROLLEN; 
*(int *)CMSG DATA(cmptr) = fd to send; /* the fd to pass */ 
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buf(1] = 0; /* zero status means OK */ 


buf[0] = 0; /* null byte flag to recv fd() */ 
if (sendmsg(fd, &msg, 0} != 2) 

return(-1):; 
return (Q); 


17-13. 通过 UNIX 域 套 接 字 发 送 文件 描述 符 
为 了 接收 一 个 文件 描述 符 《〈 见 图 17-14)， 我 们 为 cmsghdr 结构 和 描述 符 分 配 了 足够 大 的 空 
[B], RE msg control 指向 该 分 配 到 的 存储 区 ， 然 后 调用 了 recvmsg。 使 用 CMSG LEN 宏 计 
算 所 需 的 空间 总 量 。 
读 取 UNIX 域 套 接 字 ， 直 至 读 到 null 字 节 ， 它 位 于 最 后 的 状态 字 节 之 前 。null 字 节 之 前 是 一 
条 来 自发 送 者 的 出 错 消 息 。 


#include "apue.h" 
#include <sys/socket.h> /* struct msghdr */ 


/* size of control buffer to send/recv one file descriptor */ 
define CONTROLLEN CMSG LEN(sizeof (int)) 


static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 

* Receive a file descriptor from a server process. Also, any data 
* received is passed to (*userfunc) (STDERR FILENO, buf, nbytes). 

* We have a 2-byte protocol for receiving the fd from send fd(). 
oy 

int 

recv_fd(int fd, ssize_t (*userfunc) (int, const void *, size_t)) 


{ 


int newfd, nr, status; 
char *ptr; 
char buf (MAXLINE] ; 
struct iovec ioví(1]: 
struct msghdr msg; 
status - -1; 
for ($$ ; k^ 
iov[0].iov base = buf; 
iov[0].iov len = sizeof (buf); 
msg.msg iov = iov; 
msg.msg iovlen = 1; 
msg.msg narme = NULL; 
msg.msg namelen = 0; 
if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 
returní-1); 
msg.msg control = cmptr; 


msg.msg controllen = CONTROLLEN; 

if ((nr = recvmsg(fd, &msg, 0)) < 0) { 
err ret("recvmsg error"); 
return(-1); 

) else if (nr -- 0) ( 


17.44 传送 文件 描述 符 523 


err_ret ("connection closed by server"); 
return (-1); 


} 


/* 
* See if this is the final data with null & status. Null 
* is next to last byte of buffer; status byte is last byte. 
* Zero status means there is a file descriptor to receive. 
*/ 
for (ptr = buf; ptr < &buf[nr]; ) { 
if (*ptrt+ == 0) | 
if (ptr != &buf[nr-11) 
err Gump ("message format error"); 
Status = *ptr & OxFF; /* prevent sign extension */ 
if (status == 0) { 
if (msg.msg_controllen < CONTROLLEN) 
err dump("status = 0 but no fd"); 
newfd = *(int *)CMSG DATA(cmptr); 


) else ( 
newfd - -status; 
! 
nr -= 2; 
} 
} 
if (nr > O && (*userfunc) (STDERR FILENO, buf, nr) != nr) 
return(-1); 
if (status >= 0) /* final data has arrived */ 
return (newfd); /* descriptor, or -status */ 


图 17-14. 通过 UNIX 域 套 接 字 接收 文件 描述 符 

注意 , 该 程序 总 是 准备 接收 一 个 描述 符 (在 每 次 调用 recvmsg 之 前 , RE msg control 
和 msg_controllen), 但 是 仅 当 msg_controllen 返回 的 是 非 0 值 时 ， 才 确实 接收 到 描 
述 符 。 

回忆 serv accept MX (WA 17-9) 确定 调用 者 身份 的 步骤 。 如 果 内 核能 够 把 调用 者 的 证 
书 在 调用 accept 之 后 返回 给 调用 处 会 更 好 。 某 些 UNIX 域 套 接 字 的 实现 提供 类 似 的 功能 ， 但 它 
们 的 接口 不 同 。 

FreeBSD 8.0 和 Linux 3.2.0 都 支持 通过 UNIX 域 套 接 字 发 送 证 书 ， 但 它们 的 实现 方式 不 同 。 
Mac OS X 10.6.8 是 部 分 从 FreeBSD 派生 出 来 的 ， 但 禁止 传送 证 书 。Solaris 10 不 支持 通过 UNIX 
| 域 套 接 宇 传送 证 书 ， 然 而 它 支持 从 一 个 通过 STREAMS 管道 传输 文件 描述 符 的 进程 中 获得 证 书 ， 
”这 里 我 们 不 讨论 它 的 细节 。 


在 FreeBSD 中 ， 将 证 书 作 为 cmsgcred 结构 传送 。 


#define CMGROUP MAX 16 
struct cmsgcred { 


v — s PN 


pid t cmcred pid; /* sender's process ID */ 
uid t cmcred uid; /* sender's real UID */ 
uid t cmcred euid; /* sender's effective UID */ 


gid t cmcred gid; /* sender's real GID */ 
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short cmcred ngroups; /* number of groups */ 
gid t cmcred groups[(CMGROUP MAX]; /* groups */ 
H 


在 传送 证 书 时 ， 仅 需 为 cmsgcred 结构 保留 存储 空间 。 内 核 将 填充 该 结构 以 防止 应 用 程序 伪装 成 
具有 另 一 种 身份 。 
在 Linux 中 ， 将 证 书 作 为 ucred 结构 传送 。 


struct ucred { 
pid t pid; /* sender's process ID */ 
uid t uid; /* sender's user ID */ 
gid t gid; /* sender's group ID */ 
}; 


与 FreeBSD 不 同 ，Linux 需要 在 传输 前 初始 化 这 个 结构 。 内 核 会 确保 应 用 程序 要 么 能 够 使 用 对 应 
调用 者 的 值 ， 要 么 有 使 用 其 他 值 的 合适 权限 。 
17-15 显示 了 更 新 过 后 的 send_fd 函数 ， 它 包含 了 发 送 进程 的 证 书 。 


#include "apue.h" 
finclude <sys/socket.h> 





#if defined(SCM CREDS) /* BSD interface */ 
#define CREDSTRUCT cmsgcred 

#define SCM CREDTYPE SCM CREDS 

*elif defined(SCM CREDENTIALS) /* Linux interface */ 
#define CREDSTRUCT ucred 

#define SCM CREDTYPE SCM CREDENTIALS 

#else 

#error passing credentials is unsupported! 

#endif 


/* size of control buffer to send/recv one file descriptor */ 
#define RIGHTSLEN CMSG LEN (sizeof(int)) 

#define CREDSLEN CMSG LEN (sizeof (struct CREDSTRUCT)) 
#define CONTROLLEN (RIGHTSLEN + CREDSLEN) 


Static struct cmsghdr *cmptr = NULL; /* malloc'ed first time */ 


/* 
* Pass a file descriptor to another process. 
* If fd«0, then -fd is sent back instead as the error status. 
*/ 
int 
send fd(int fd, int fd to send) 
i 
struct CREDSTRUCT *credp; 


struct cmsghdr *cmp; 

struct iovec iov[1]; 

struct msghdr msg; 

char buf [2]; /* send_fd/recv_ufd 2-byte protocol */ 


iov[0].iov base = buf; 
iov[0].iov len = 2; 
msg.msg iov iov; 
msg.msg iovlen 


1; 
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msg.msg name = NULL; 
msg.msg namelen - 0; 
msg.msg flags = 0; 

if (fd to send < 0) { 


msg.msg, control = NULL; 
msg.msg controllen = 0; 
buf[1] = -fd to send; /* nonzero status means error */ 


if (buf[1] == 0) 
buf[1] = 1; /* -256, etc. would screw up protocol */ 


) else ( 
if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 
return(-1); 
msg.msg, control = Cmptr; 


msg.msg, controllen = CONTROLLEN; 
cmp = cmptr; 
cmp-»omsg level = SOL SOCKET; 


cmp-»cmsq type = SCM RIGHTS; 
cmp-»cmsg len = RIGHTSLEN; 
*(int *)CMSG DATA(cmp) = fd to send; /* the fd to pass */ 


cmp = CMSG, NXTHDR(&msg, cmp); 

cmp-»cmsg level = SOL SOCKET; 

cmp-»ocmsg type SCM_CREDTYPE; 

cmp-»cmsg len = CREDSLEN; 

credp = (struct CREDSTRUCT *)CMSG DATA(cmp); 


dif defined(SCM CREDENTIALS) 


credp-»uid = geteuid(); 


credp-»gid = getegid(); 
credp->pid = getpid{); 
#endif 
buf[1] = 0; /* zero status means OK */ 
} 
buf[0] = 0; /* null byte flag to recv_ufd() */ 


if (sendmsg(fd, &msg, 0) != 2) 


return (-1); 


return (0); 





17-15 通过 UNIX 域 套 接 字 发 送 证 书 


注意 ， 只 有 在 Linux 上 才 需 要 初始 化 证 书 结构 。 
图 17-16 中 的 recv_ufd 函数 是 recv_fd 的 修改 版 ， 它 通过 一 个 引用 参数 返回 发 送 者 的 用 户 ID。 





#include "apue.h" 
#include <sys/socket.h> /* struct msghdr */ 
#include «sys/un.h» 


#if defined (SCM_CREDS) /* BSD interface */ 
#define CREDSTRUCT cmsgcred 

Kdefine CR UID cmcred uid 

#define SCM CREDTYPE SCM CREDS 

#elif defined (SCM CREDENTIALS) /* Linux interface */ 
#9define CREDSTRUCT ucred 

#define CR UID uid 

#define CREDOPT SO_PASSCRED 

#define SCM_CREDTYPE SCM_CREDENTIALS 


#else 
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#error passing credentials is unsupported! 
#endif 


/* size of control buffer to send/recv one file descriptor */ 
tdefine RIGHTSLEN CMSG LEN(sizeof(int)) 

#define CREDSLEN CMSG_LEN (sizeof (struct CREDSTRUCT)) 
#define CONTROLLEN (RIGHTSLEN + CREDSLEN) 


static struct cmsghdr *emptr = NULL; /* malloc'ed first time */ 


/* 

* Receive a file descriptor from a server process. Also, any data 
* received is passed to (*userfunc) (STDERR FILENO, buf, nbytes). 

* We have a 2-byte protocol for receiving the fd from send fd(). 
*/ 

int 

recv ufd(int fd, uid t *uidptr, 

ssize t (*userfunc) (int, const void *, size t)) 


struct cmsghdr *cmp; 

struct CREDSTRUCT *credp; 

char *ptr; 

char buf [MAXLINE]; 

struct iovec iov[1]; 

struct msghdr msg; 

int nr; 

int newfd = -1; 

int Status - -1; 
#if defined (CREDOPT) 

const int on = 1; 


if (setsockopt (fd, SOL SOCKET, CREDOPT, &on, sizeof(int)) < 0) { 
err ret("setsockopt error"); 
return (-1); 


} 


#endif 
for (; 7) í 

iov[0].iov base = buf; 
iov[(0].iov len = sizeof (buf); 
msg.msg iov = iov; 
msg.msg iovlen = 1; 
msg.msg name = NULL; 
msg.msg namelen - 0; 


if (cmptr == NULL && (cmptr = malloc(CONTROLLEN)) == NULL) 
returní-1); 

msg.msg control cmptr; 

msg.msg controllen CONTROLLEN; 

if ((nr = recvmsg(fd, &msg, 0)) < 0) { 
err ret("recvmsg error"); 
return(-1); 

} else if (nr == 0) ( 

err ret (“connection closed by server"); 

return(-1); 
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/* 
* See if this is the final data with null & status. Null 
* is next to last byte of buffer; status byte is last byte. 
* Zero status means there is a file descriptor to receive. 
E 
for (ptr = buf; ptr < &buf[nr]; ) | 
if (*ptr++ == 0) { 
if (ptr != &buf[nr-1]) 
err_dump("message format error"); 
Status = *ptr & OxFF; /* prevent sign extension */ 
if (status == 0) { 
if (msg.msg controllen != CONTROLLEN) 
err dump("status = 0 but no fd"); 


/* process the control data */ 
for (cmp = CMSG, FIRSTHDR(&msq) ; 
cmp != NULL; cmp = CMSG NXTHDR(&msg, cmp)) { 
if (cmp-»cmsg level !- SOL SOCKET) 
continue; 
switch (cmp-»cmsg type) { 
case SCM RIGHTS: 
newfd = *(int *)CMSG DATA(cmp); 
break; 
Case SCM CREDTYPE: 
credp = (struct CREDSTRUCT *)CMSG, DATA (cmp}; 
*uidptr = credp-»CR UID; 


) 


} else { 
newfd = -status; 
} 
nr -= 2; 
} 
} 
if (nr > 0 && (*userfunc) (STDERR FILENO, buf, nr) != nr) 
return(-1); 
if (status >= 0) /* final data has arrived */ 
return (newfd) ; /* descriptor, or -status */ 





17-16 通过 UNIX 域 套 接 字 接 收 证 书 
在 FreeBSD 中 ， 指 定 SCM CREDS 表示 要 传送 证 书 。 在 Linux 中 ， 则 使 用 SCM CREDENTIALS. 


17.5 open 服务 器 进程 第 1 版 


使 用 文件 描述 符 传送 技术 开发 一 个 open 服务 器 进程 一 一 一 个 由 一 个 进程 执行 以 打开 一 个 或 
多 个 文件 。 该 服务 器 进程 不 是 将 文件 内 容 送 回 调用 进程 ， 而 是 送 回 一 个 打开 文件 描述 符 。 这 使 该 
服务 器 进程 对 任何 类 型 的 文件 〈 如 设备 或 套 接 字 ) 而 不 单 是 普通 文件 都 能 起 作用 。 客 户 进程 和 服 
务 器 进程 用 IPC 交换 最 小 量 的 信息 : 从 客户 进程 到 服务 器 进程 传送 文件 名 和 打开 模式 ， 而 从 服务 
器 进程 到 客户 进程 返回 描述 符 。 文 件 内 容 不 需 通过 IPC 交换 。 
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将 服务 器 进程 设计 成 一 个 单独 的 可 执行 程序 (或 者 是 由 客户 进程 执行 的 ， 这 正 是 本 节 所 说 明 
的 ;或 者 是 由 守护 服务 器 进程 执行 的 ， 将 在 下 一 节 进 行 说 明 》 有 很 多 优点 。 
。 任何 客户 进程 都 能 很 容易 地 和 服务 器 进程 联系 ， 这 类 似 于 客户 进程 调用 一 个 库 函 数 。 我 
们 没有 将 特定 服务 硬 编码 在 应 用 程序 中 ， 而 是 设计 了 一 种 可 供 重用 的 设施 。 
。 如 若 需 要 更 改 服务 器 进程 ， 那 么 也 只 影响 一 个 程序 。 相 反 ， 更 新 一 个 库 函 数 可 能 需要 更 
新 调用 此 库 函 数 的 所 有 程序 〈 即 用 连接 编辑 器 重新 连接 )。 共 享 库 函 数 可 以 简化 这 种 更 新 
( 见 7.7 节 )。 
。 服务 器 进程 可 以 是 一 个 设置 用 户 ID 程序 ， 于 是 使 其 具有 客户 进程 没有 的 附加 权限 。 注 意 ， 
库 函 数 〈 或 共享 库 函 数 ) 不 能 提供 这 种 能 力 。 
客户 进程 创建 一 个 fd 管道 ， 然 后 调用 fork 和 exec 来 调用 服务 器 进程 。 客 户 进程 使 用 一 端 
经 fd 管道 发 送 请 求 ， 服 务 器 进程 使 用 另 一 端 经 fd 管道 回 送 响应 。 
定义 客户 进程 和 服务 器 进程 闻 的 应 用 程序 协议 如 下 。 
(1) 客户 进程 通过 fd 管道 向 服务 器 进程 发 送 “open <pathname> <openmode>\0” 形 式 的 请 
求 。<openmode> 是 数值 ， 以 ASCU 十 进 制 数 表示 ， 是 open 函数 的 第 二 个 参数 。 该 请 求 字符 串 以 
null 字符 终止 。 
(2) 服务 器 进程 调用 send fd 或 send err 回 送 打开 撕 述 符 或 出 错 消 息 。 
这 是 一 个 进程 向 其 父 进 程 发 送 打 开 描 述 符 的 实例 。17.6 节 将 修改 此 实例 来 使 用 一 个 守护 服务 
器 进程 ， 它 的 服务 器 进程 将 一 个 描述 符 发 送 给 一 个 完全 无 关 的 进程 。 
首先 要 有 一 个 头 文件 open ,h (AR 17-17)， 它 包括 标准 头 文件 ， 并 且 定 义 了 函数 原型 。 


#include "apue.h" 
#include <errno.h> 


#define CL OPEN "open" /* client's request for server */ 


int csopen(char *, int); 
图 17-17 open.h 头 文件 


main 函数 (WL 17-18) 是 一 个 循环 ， 它 先 从 标准 输入 读 一 个 路 径 名 ， 然 后 将 该 文件 复制 到 
标准 输出 。 它 调用 csopen 函数 来 联系 open 服务 器 进程 ， 从 其 返回 一 个 打开 描述 符 。 


#include "open.h" 
#include «fcntl.h» 
#define BUFFSIZE 8192 


int 
main(int argc, char *argvíl) 
{ 


int n, fd; 

char buf [BUFFSIZE]; 

char line [MAXLINE] ; 

/* read filename to cat from stdin */ 

while (fgets(line, MAXLINE, stdin) != NULL) { 


if (line[strlen(line) - 1] == '\n') 
line[strlen(line) - 1] = 0; /* replace newline with null */ 
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/* open the file */ 
if ((fd = csopen(line, O RDONLY)) < 0) 


continue; 


/* and cat to 


/* csopen() prints error from server */ 


stdout */ 


while ((n = read(fd, buf, BUFFSIZE)) > 0) 
if (write(STDOUT FILENO, buf, n) != n) 
err sys("write error"); 


if (n < 0) 
err Sys("r 
close(fd); 


exit(0); 


函数 csopen〈 见 图 17-19) 在 创建 了 fd 管道 之 后 ， 进 行 了 服务 器 进程 的 fork 和 exec 操作 。 


ead error"); 


17-18 main 函数 


#include "open.h" 
#include <sys/uio.h> /* struct iovec */ 
/* 


* Open the file by sen 
* connection server an 


ding the "name" and "oflag" to the 
d reading a file descriptor back. 


Sy 
int 
csopen(char *name, int oflag) 
{ 
pid t pid; 
int len; 
char buf [10]; 


struct iovec iov[ 


3); 


static int fd[2] = ( -1, -1 }3 


if (fd[0] < 0) I 


/* fork/exec our open server first time */ 


if (fd pipe(fd) < 0) { 
err ret("fd pipe error"); 
returní-1); 


) 


if ((pid = fork()) < 0) ( 
err ret("fork error"); 


return(-1) 


. 
, 


} else if (pid == 0) { /* child */ 
close (fd[0j); 
if (fd[1] != STDIN FILENO && 
dup2(fd[1], STDIN FILENO) != STDIN FILENO) 


err sys("dup2 error to stdin"); 


if (fd[1] 


!= STDOUT FILENO && 


dup2(fd[1], STDOUT FILENO) !- STDOUT FILENO) 


err sy 
if (execl ( 


s("dup2 error to stdout”); 
"./opend^, "opend", (char *)0) « Q) 


err sys("execl error"); 


] 
close(fd(11); 


/* parent */ 


530 3817 3€ 高 级 进程 间 通 信 





} 


sprintf{buf, " $&d", oflag); /* oflag to ascii */ 

iov[0].iov base - CL OPEN " "; /* string concatenation */ 
iov[0].iov len = strlen(CL OPEN) + 1; 

iov[1].iov base - name; 

iov[1].iov len = strlen (name); 

iov[2].iov.base = buf; 

iov[2].iov len = strlen(buf) + 1; /* *1 for null at end of buf */ 


len = iov[0].iov len + iov[1].iov len + iov[2].iov len; 


if (writev(fd[0], &iov[0], 3) 


err ret("writev error"); 


return(-1); 


} 


!- len) { 


/* read descriptor, returned errors handled by write() */ 
return(recv fd(fd[0], write)); 
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子 进程 关闭 fd 管道 的 一 端 ， 父 进程 关闭 另 一 端 。 作 为 服务 器 进程 ， 子 进程 也 将 fd 管道 的 一 
端 复制 到 其 标准 输入 和 标准 输出 。( 另 一 种 可 选择 的 方案 是 ， 将 描述 符 fa [1] 的 ASCH 表示 形式 
作为 一 个 参数 传送 给 服务 器 进程 。) 
父 进 程 将 包含 路 径 名 和 打开 模式 的 请 求 发 送 给 服务 器 进程 。 最 后 ， 父 进程 调用 recv_fa 返回 描 
述 符 或 出 错 消 息 。 如 果 服 务 器 进程 返回 出 错 消 息 ， 那 么 父 进程 调用 write， 向 标准 错误 输出 该 消息 。 
现在 ， 让 我 们 来 看 看 open 服务 器 进程 。 其 程序 是 opend， 由 图 17-19 中 的 子 进程 执行 。 首 先 ， 
要 有 一 个 opend.h 头 文件 〈 见 图 17-20)， 它 包括 标准 头 文件 ， 并 且 声 明了 全 局 变量 和 函数 原型 。 


#include "apue.h" 
#include <errno.h> 


$define CL OPEN "open" 


extern char errmsg[]: 
extern int oflag; 
extern char *pathname; 


int 
void 


/* 


/* 
/* 
/* 


cli args(int, char **); 
handle request(char *, int, int); 


图 17-20 opend.h 汰 文件 


client's request for server */ 


error message string to return to client */ 
open() flag: O xxx ... */ 
of file to open() for client */ 


main 函数 〈 见 图 17-210 经 fd 管 道 〈 它 的 标准 输入 ) 读 来 自 客户 进程 的 请 求 ， 然 后 调用 函 


W handle request. 





#include "opend.h" 
char errmsg [MAXLINE] ; 
int oflag; 

char *pathname; 

int 


main (void) 


{ 
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int nread; 
char buf [MAXLINE]; 


for (; : ) (/* read arg buffer from client, process request */ 
if ((nread = read(STDIN FILENO, buf, MAXLINE)) < O0) 
err sSys("read error on stream pipe"); 
else if (nread -- Q) 
break; /* client has closed the stream pipe */ 
handle request(buf, nread, STDOUT FILENO); 


) 
exit(0):; 
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17-22 HAY handle_request 函数 承担 了 全 部 工作 。 它 调用 函数 buf _ args 将 客户 进程 请 求 分 
解 成 标准 argv 型 的 参数 表 ， 然 后 调用 函数 cli args 处 理 客户 进程 的 参数 。 如 果 一 切 正常 ， 则 调用 
open 打开 相应 文件 ， 接 着 调用 sena fd. Ah fa 管 道 〈 它 的 标准 输出 ) 将 描述 符 回 送 给 客户 进程 。 

如 果 出 错 则 调用 send err 回 送 一 则 出 错 消 息 ， 其 中 使 用 了 前 面 说 明 的 客户 进程 -服务 器 进程 协议 。 


#include "opend.h" 
#include «fcntl.h» 
void 


handle request(char *buf, int nread, int fd) 


{ 
int newfd; 


if (buf[nread-i] != 0) I 
snprintf (errmsg, MAXLINE-1, 
"request not null terminated: %*.*s\n", nread, nread, buf); 
send err(fd, -1, errmsg); 
return; 
} 
if (buf args(buf, cli args) < 0) { /* parse args & set options */ 
send err(fd, -1, errmsg); 
return; 
} 
if ((newfd = open (pathname, oflag)) < 0) 1 
snprintf (errmsg, MAXLINE-1, "can't open $s: %s\n", pathname, 
strerror(errno)); 
send err(fd, -1, errmsg); 


return; 

} 

if (send_fd(fd, newfd) < 0) /* send the descriptor */ 
err sys("send fd error"); 

close (newfd); /* we're done with descriptor */ 





17-22 handle request 函数 第 1 版 
客户 进程 请 求 是 一 个 以 null 终止 的 字符 串 ， 它 包含 由 空格 分 隔 的 参数 。 图 17-23 中 的 buf_ 
args 函数 将 字符 串 分 解 成 标准 argv 型 参数 表 ， 并 调用 用 户 函 数 处 理 参数 。 我 们 使 用 ISO Cw 
数 strtok 将 字符 串 分 割 成 独立 的 参数 。 
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#include "apue.h" 


#define MAXARGC 50 /* max number of arguments in buf */ 
#define WHITE "\t\n" /* white space for tokenizing arguments */ 
/* 


* buf[] contains white-space-separated arguments. We convert it to an 
* argv-style array of pointers, and call the user's function (optfunc) 
* to process the array. We return -1 if there's a problem parsing buf, 
* else we return whatever optfunc() returns. Note that user's buf[] 

* array is modified (nulls placed after each token). 


int 
buf args(char *buf, int (*optfunc) (int, char **)) 


char *ptr, *argv [MAXARGC] ; 
int argc; 
if (strtok(buf, WHITE) == NULL) /* an argv[0] is required */ 


returní-1); 

argv[argc = 0] = buf; 
while ((ptr = strtok(NULL, WHITE)) !- NULL) { 

if (*targc >= MAXARGC-1) /* -1 for room for NULL at end */ 

return(-1); 

argv[argc] = ptr; 
} 
argv[+targe] = NULL; 


/* 

* Since argv[] pointers point into the user's buf[], 
* user's function can just copy the pointers, even 
* though argv[] array will disappear on return. 

t7 


return((*optfunc) (arge, argv)); 
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buf args 调用 的 服务 器 进程 函数 是 cli_args〔 见 图 17-24)。 它 验证 客户 进程 发 送 的 参数 
个 数 是 否 正确 ， 然 后 将 路 径 名 和 打开 模式 存储 在 全 局 变量 中 。 


#include "opend.h" 





* This function is called by buf args(), which is called by 
* handle request(). buf args() has broken up the client's 
* buffer into an argv[]-style array, which we now process. 


int 
cli args(int argc, char **argv) 
{ 
if (argc !- 3 || strcmp(argv[0], CL OPEN) != 0) I 
strcpy(errmsg, "usage: <pathname> <oflag>\n"); 
return(-1); 
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pathname = argv[1]: /* save ptr to pathname to open */ 
oflag = atoi(argv[2]); 
returní0); 


Pl 17-24 cli args M% 


这 样 也 就 完成 了 open 服务 器 进程 ， 它 由 客户 进程 执行 fork 和 exec 来 调用 。 在 fork 之 前 
创建 了 一 个 fd 管道 ,然后 客户 进程 和 服务 器 进程 用 其 进行 通信 。 在 这 种 安排 下 ， 每 个 客户 进程 都 
有 一 个 服务 器 进程 。 
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在 上 一 节 中 ,我 们 开发 了 一 个 open 服务 器 进程 ， 由 客户 进程 执行 fork 和 exec WH, CIR 
明了 如 何 从 子 程序 向 父 程 序 传送 文件 描述 符 。 本 节 将 开发 一 个 守护 进程 方式 的 open 服务 器 进程 。 
一 个 服务 器 进程 处 理 所 有 客户 进程 的 请 求 。 由 于 避免 了 使 用 fork 和 exec， 我 们 期 望 这 个 设计 
会 更 有 效 。 在 客户 进程 和 服务 器 进程 之 间 仍 使 用 UNIX 域 套 接 字 连 接 ， 并 用 实例 说 明 在 两 个 无 关 
进程 之 间 如 何 传送 文件 描述 符 。 我 们 将 使 用 17.3 SIAR 3 SRM: serv listen. serv. 
accept 和 cli_conn。 这 个 服务 器 进程 还 将 演示 一 个 服务 器 进程 如 何 处 理 多 个 客户 进程 ， 为 此 
要 用 到 14.4 节 中 说 明 的 select 和 poll AR. 

本 节 所 述 的 客户 进程 类 似 于 17.5 节 中 的 客户 进程 。 实 际 上 ， 文 件 main.c 是 完全 相同 的 ( 见 
17-18)。 我 们 将 在 open .h 头 文件 〈 见 图 17-17) 中 加 入 下 面 这 行 : 

#define CS OPEN "/tmp/opend.socket" /* server's well-known name */ 
因为 在 此 例 中 调用 的 是 cli conn 而 非 fork 和 exec. 所 以 文件 open.c 与 图 17-19 PHAR. 
修改 后 如 图 17-25 所 示 。 


#include "open.h" 
#include «sys/uio.h» /* struct iovec */ 
/* 


* Open the file by sending the "name" and "oflag" to the 
* connection server and reading a file descriptor back. 
*/ 

int 

csopen(char *name, int oflag) 

{ 


int len; 

char buf[12]; 

struct iovec iov[3]; 

static int esfd = -l; 

if (csfd < 0) { /* open connection to conn server */ 


if ((csfd = cli conn(CS OPEN)) « 0) { 
err ret("cli conn error"); 
return(-1); 


) 


sprintf (buf, " 5d", oflag); /* oflag to ascii */ 
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iov[0].iov base CL OPEN " "; /* string concatenation */ 
iov[0].iov len = strlen(CL OPEN) + 1; 
iov(l1l.iov base = name; 


iov[1].iov len = strlen (name); 

iov[2].iov base - buf; 

iov[2].iov len = strlen(buf) + 1; /* null always sent */ 
len = iov[0].iov len + ioví1ll.iov len + iov[2].iov len: 
if (writev(csfd, &iov[0], 3) != len) ( 


err ret("writev error"); 
returní-1):; 


/* read back descriptor; returned errors handled by write() */ 
return (recv_fd (csfd, write)); 
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客户 进程 与 服务 器 进程 之 间 使 用 的 协议 仍然 相同 。 
接 下 来 再 看 服务 器 进程 。 头 文件 opend.n (LA 17-26) 包括 了 标准 头 文件 ， 并 且 声 明了 全 
局 变量 和 函数 原型 。 


#include "apue.h" 
#include «errno.h» 





#define CS OPEN "/tmp/opend.socket" /* well-known name */ 

#define CL OPEN "open" /* client's request for server */ 
extern int debug; /* nonzero if interactive (not daemon) */ 
extern char errmsg[]; /* error message string to return to client */ 
extern int oflag: /* open flag: O xxx ... */ 


extern char  *pathname; /* of file to open for client */ 


typedef struct { /* one Client struct per connected client */ 
int fd; /* fd, or -1 if available */ 
uid t uid; 
} Client; 
extern Client*client; /* ptr to malloc'ed array */ 
extern int client size; /* € entries in client[] array */ 
int cli args(int, char **); 
int client,add(int, uid t); 
void client del(int); 
void loop (void) ; 
void handle request(char *, int, int, uid t); 
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因为 此 服务 器 进程 处 理 所 有 客户 进程 ， 所 以 它 必须 保存 每 个 客户 进程 连接 的 状态 。 这 是 用 在 
opend.h 头 文件 中 声明 的 client 数组 实现 的 。 图 17-27 定义 了 3 个 处 理 此 数组 的 函数 。 





#include "opend.h" 


#define NALLOC 10 /* # client structs to alloc/realloc for */ 
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static void 


client, alloc (void) /* alloc more entries in the client[] array */ 
{ 


int i; 


if {client == NULL) 

client malloc(NALLOC * sizeof(Client)); 
else 

client = realloc(client, (client size*NALLOC)*sizeof (Client)); 
if (client -- NULL) 

err sys("can't alloc for client array"); 


/* initialize the new entries */ 
for (i = client size; i « client size + NALLOC; i++) 
client(i]).fd = -1; /* fd of -1 means entry available */ 


client size += NALLOC; 


/* 

* Called by loop() when connection request from a new client arrives. 
*/ 

int 

client add(int fd, uid t uid) 

i 


int i; 
if (client == NULL) /* first time we're called */ 
client alloc():; 
again: 
for (i = 0; i < client size; i++) { 
if (client[i].fd == -1) ( /* find an available entry */ 
client[i].fd = fd; 
client [i].uid = uid; 
return(i);/* return index in client[] array */ 
) 
} 


/* client array full, time to realloc for more */ 
client alloc(); 


goto again; /* and search again (will work this time) */ 
} 
/* 
* Called by loop() when we're done with a client. 
* 
void 


client del(int fd) 
{ 


int i; 


for {i = 0; i < client size; i++) 1 
if (client[il.fd == fd) { 
client[i].fd = -1; 
return; 


536 53517 2€ 高 级 进程 间 通 信 


} 
} 
log quit("can't find client entry for fd td", fd); 


图 17-27 APE client 数组 的 3 个 函数 


第 一 次 调用 client add 时 , CWA client alloc. client alloc 又 调用 malloc 为 
该 数组 的 10 个 登记 项 分 配 空间 。 在 这 10 个 登记 项 全 部 用 完 后 ， 如 若 再 调用 client_add, WA 
client alloc 函数 将 调用 realloc 来 分 配 附加 空间 。 依 靠 这 种 动态 空间 分 配 ， 我 们 无 需 在 编 
译 时 将 估计 的 数组 长 度 值 放 入 头 文件 中 从 而 限制 client 数组 的 长 度 。 如 果 出 错 ， 这 些 函 数 将 调 
用 1og_ 函 数 〈 见 附录 B)， 因 为 我 们 假定 服务 器 进程 是 守护 进程 。 

通常 服务 器 进程 会 作为 守护 进程 运行 ， 但 我 们 想 提 供 一 个 让 其 前 台 运 行 的 选项 ， 同 时 能 够 把 
分 析 信 息 发 送 到 标准 错误 输出 。 这 应 该 能 使 服务 器 更 容易 评测 和 调试 ， 特 别 是 当 用 户 没有 权限 读 
a a 志文 件 时 。 可 以 使 用 一 个 命令 行 选项 来 控制 服务 器 是 否 在 前 台 运 行 
或 者 作为 守护 进程 在 后 台 运 

Ae FUSAT UE HE ORA 因为 这 会 提高 它 的 易 用 性 。 如 果 有 人 熟 
悉 某 条 命令 的 选项 风格 ， 那 么 若 后 面 的 命令 使 用 了 其 他 的 风格 ， 他 就 很 容易 犯错 。 

处 理 命 令 行 空格 就 很 容易 发 生 这 样 的 问题 。 有 些 命令 需要 它 的 选项 和 其 参数 以 空格 隔 开 ， 而 
另 一 些 则 希望 它 的 参数 直接 跟 在 它 的 选项 之 后 。 如 果 没 有 遵循 一 个 一 致 的 规则 ， 用 户 就 得 记 住 所 
有 命令 的 语法 ， 或 者 在 尝试 和 调 错 中 调用 这 些 命令 。 

Single UNIX Specification 包括 了 一 系列 的 约定 和 规范 来 保证 命令 行 语法 的 一 致 性 ， 其 中 包括 一 些 建 
议 ， 如 “限制 每 个 命令 行 选 项 为 一 个 单一 的 阿拉 伯 字 符 ” 以 及 “所 有 选项 必须 以 一 ”作为 开头 字符 ”。 

幸运 的 是 ，getopt 函数 能 够 帮助 命令 开发 者 以 一 致 的 方式 处 理 命令 行 选 项 。 
#include <unistd.h> 
int getopt (int arge, char * const argv[], const char *options) ; 
extern int optind, opterr, optopt; 


extern char *optarg; 





参数 arge 和 argv 与 传 入 main 函数 的 一 样 。oprions 参数 是 一 个 包含 该 命令 支持 的 选项 字符 
的 字符 串 。 如 果 一 个 选项 字符 后 面 接 了 一 个 冒号 ， 则 表示 该 选项 需要 人 参数， 否则， 该 选项 不 需要 
额外 参数 。 举 例 来 说 ， 如 果 一 条 命令 的 用 法 说 明 如 下 ， 


command [-i) [-u username] [-z] filename 


则 我 们 可 以 给 getopt 传送 一 个 "iu:z" 作 为 options FRAR. 

函数 getopt 一 般 用 在 循环 体内 ， 循 环 直 到 getopt 返回 -1 时 退出 。 每 次 迭代 中 ，getopt 
会 返回 下 一 个 选项 。 应 用 程序 负责 筛选 这 些 选 项 ， 判 断 是 咎 有 冲突 ，getopt 仅 负责 解释 选项 并 
保证 一 个 标准 的 格式 。 

当 遇 到 无 效 的 选项 时 ，getopt 返回 一 个 问题 标记 〈question mark) 而 不 是 这 个 字符 。 如 果 选 项 缺 
少 参数 ，getopt 也 会 返回 一 个 问题 标记 ， 但 如 果 选 项 字符 串 的 第 一 个 字符 是 冒号 ，getopt 会 直接 返 
回 冒 号 。 而 特殊 的 “-- ”格式 则 会 导致 getopt 停止 处 理 选项 并 返回 -1]。 这 人 允许 用 户 传 递 以 “-” 开 头 
但 不 是 选项 的 参数 。 例 如 ， 如 果 有 一 个 名 字 为 “~-bar” 的 文件 ， 下 面 的 命令 行 是 无 法 删除 这 个 文件 的 : 
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rm -bar 
因为 rm 会 试图 把 -bar 解释 为 选项 。 正 确 的 删除 文件 的 命令 应 该 是 : 
rm -- -bar 


getopt BAU FE 4 个 外 部 变量 。 
optarg 如 果 一 个 选项 需要 参数 , 在 处 理 该 选项 时 , getopt 会 设置 optarg 指向 该 选项 的 
参数 字符 串 。 
opterr 如 果 一 个 选项 发 生 了 错误 ，getopt 会 默认 打印 一 条 出 错 消息 。 应 用 程序 可 以 通过 
WE opterr 参数 为 0 来 禁止 这 个 行为 。 
optind 用 来 存放 下 一 个 要 处 理 的 字符 串 在 argv 数组 里 的 下 标 。 它 从 1 开始 , 每 处 理 一 个 
BR, getopt 都 会 对 其 递增 1。 
optopt 如 果 处 理 选 项 时 发 生 了 错误 ，getopt 会 设置 optopt 指向 导致 出 错 的 选项 字符 串 。 
open 服务 器 进程 的 main PRÉC OLA 17-28) 定义 全 局 变量 , 处 理 命令 行 选项 , 并 且 调 用 loop 
函数 。 如 果 以 -da 选项 调用 服务 器 进程 ， 则 服务 器 进程 将 以 交互 方式 运行 而 非 守 护 进程 方式 。 测 试 
服务 器 进程 时 会 用 到 这 个 选项 。 


#include "opend.h" 

#include <syslog.h> 

int debug, oflag, client_size, log_to_stderr; 

char errmsg [MAXLINE] ; 

char *pathname; 

Client *client = NULL; 
int 


main(int argc, char *argv[]) 
{ 
int C; 


log opení("open.serv", LOG PID, LOG USER); 


opterr = 0; /* don't want getopt() writing to stderr */ 
while ((c = getopt(argc, argv, "d")) != EOF) { 
switch (c) ( 
case 'd': /* debug */ 
debug = log to stderr = 1; 
break; 
Gase ?7 2371: 


err_quit ("unrecognized option: -%c", optopt); 
} 
} 


if (debug == 0) 
daemonize ("opend"); 


loop(); /* never returns */ 


图 17-28 服务 器 进程 main 函数 第 2 版 
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loop 函数 是 服务 器 进程 的 无 限 循环 。 我 们 将 给 出 该 函数 的 两 种 版 本 。 图 17-29 是 使 用 select 
的 一 种 版 本 。 图 17-30 所 示 的 程序 是 使 用 poll 的 另 一 种 版 本 。 


#include "opend.h" 

#include <sys/select.h> 

void 

loop (void) 

{ 
int i, n, maxfd, maxi, listenfd, clifd, nread; 
char buf [MAXLINE]; 


uid_t uid; 
fd_set rset, allset; 


FD ZERO(&allset); 


/* obtain fd to listen for client requests on */ 
if ((listenfd = serv listen(CS OPEN)) < 0) 
log sys("serv listen error"); 
FD SET(listenfd, &allset); 
maxfd - listenfd; 
maxi = -1; 


for (7 7) { 
rset = allset; /* rset gets modified each time around */ 
if ((n = select(maxfd + 1, &rset, NULL, NULL, NULL)) < 0) 
log sys("select error"); 


if (FD ISSET(listenfd, &rset)) ( 
/* accept new client request */ 
if ((clifd = serv accept(listenfd, &uid)) < 0) 
log sys("serv accept error: %d", clifd); 
i - client add(clifd, uid); 
FD SET(clifd, &allset); 
if (clifd > maxfd) 


maxfd = clifd; /* max fd for select() */ 
if (i > maxi) 
maxi = i; /* max index in client[] array */ 
log_msg("new connection: uid $d, fd $d", uid, clifd); 
continue; 
} 
for (i = 0; i <= maxi; i++) I /* go through client{] array */ 
if ((clifd = client[i].fd) < 0) 
continue; 


if (FD_ISSET(clifd, &rset)) { 
/* read argument buffer from client */ 
if ((nread = read(clifd, buf, MAXLINE)) < O) { 
log sys("read error on fd %d", clifd); 
} else if (nread == 0) { 
log msg("closed: uid $d, fd $d", 
client[i].uid, clifd); 
client del(clifd);/* client has closed cxn */ 
FD CLR(clifd, &allset); 
close (clifd}; 
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) else ( /* process client's request */ 
handle request(buf, nread, clifd, client[i].uid); 
} 


17-29 ft select 的 loop 函数 

此 函数 调用 serv listen (JA 17-8) 创建 服务 器 进程 与 客户 进程 连接 的 端点 。 此 函 
数 的 其 余部 分 是 一 个 循环 ， 它 从 select 调用 开始 。 在 select 返回 后 ， 可 能 会 发 生 下 面 
两 种 情况 。 

(1) 描述 符 1istenfd 可 以 随时 读 取 ， 这 意味 着 一 个 新 客户 进程 已 调用 了 cli conn. AT 
处 理 这 种 情况 , 我 们 将 调用 serv_accept (AR 17-90, 然后 为 新 客户 进程 更 新 client 数组 以 
及 与 该 新 客户 进程 相关 的 夭 记 信息 。( 我 们 要 跟踪 select 的 第 一 个 参数 的 最 高 描述 符 编号 ， 还 
要 跟踪 使 用 中 的 client 数组 的 最 高 下 标 。) 

(2) 一 个 现 有 的 客户 进程 的 连接 可 以 随时 读 取 。 这 意味 着 该 客户 进程 已 经 终止 ， 或 者 该 客户 
进程 已 发 送 一 个 新 请 求 。 如 果 read 返回 0〈 文 件 结束 )， 则 表示 客户 进程 已 终止 。 如 果 read 返 
回 的 值 大 于 0， 则 表示 有 一 个 新 请 求 需 处 理 ， 可 以 调用 request 来 处 理 。 

用 allset 描述 符 集 跟踪 当前 使 用 的 描述 符 。 当 新 客户 进程 连接 至 服务 器 进程 时 ， 会 打开 此 
描述 符 集 的 相应 位 。 当 该 客户 进程 终止 时 ， 会 关闭 相应 位 。 

因为 客户 进程 的 所 有 描述 符 都 由 内 核 自 动 关闭 (包括 与 服务 器 进程 的 连接 )， 所 以 我 们 总 能 
知道 什么 时 候 客 户 进程 终止 了 ， 该 终止 是 否 是 自愿 的 。 这 与 XSI IPC 机 制 不 同 。 

使 用 poll 函数 的 loop 函数 如 图 17-30 所 示 。 


finclude "opend.h" 
finclude «poll.h» 


#define NALLOC 10 /* # pollfd structs to alloc/realloc */ 


static struct pollfd * 
grow pollfd(struct pollfd *pfd, int *maxfd) 
{ 


int i; 


int oldmax = *maxfd; 
int newmax = oldmax + NALLOC; 
if ((pfd = realloc(pfd, newmax * sizeof(struct pollfd))) == NULL) 


err_sys("realloc error"); 

for (i = oldmax; i < newmax; i++) { 
pfd{ij.fd = -1; 
pfd[i].events = POLLIN; 
pfd[i].revents = 0; 

} 

*maxfd = newmax; 

return (pfd); 

} 


void 
loop {void} 
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int i, listenfd, clifd, nread; 
char buf [MAXLINE]; 

uid t uid; 

struct pollfd *pollfd; 

int numfd - 1; 

int maxfd = NALLOC; 


if ((pollfd - malloc(NALLOC * sizeof(struct pollfd))) -- NULL) 
err sys("malloc error"); 

for (i = 0; i < NALLOC; i++) ( 
pollfd[i].fd = -1; 
pollfd[i].events = POLLIN; 
pollfd[i].revents = 0; 


/* obtain fd to listen for client requests on */ 
if ((listenfd = serv listen(CS OPEN)) < 0) 
log sysí("serv listen error"); 
client add(listenfd, 0):  /* we use [0] for listenfd */ 
pollfd[0].fd = listenfd; 


for (7; ; ) ( 
if (poll{pollfd, numfd, -1) < 0) 
log sys("poll error"); 


if (pollfd(0].revents & POLLIN) ( 
/* accept new client request */ 
if ((clifd = serv accept(listenfd, &uid)) < 0} 
log sys("serv accept error: $d", clifd); 
client add(clifd, uid); 


/* possibly increase the size of the pollfd array */ 
if (numfd -- maxfd) 
pollfd = grow pollfd(pollfd, &maxfd); 
pollfd[numfd].fd = clifd; 
pollfd[numfd].events = POLLIN; 
pollfd[numfd].revents = 0; 
numfid++; 
log msg("new connection: uid $d, fd $d", uid, clifd); 


for (i = 1; i < numfd; i++) { 
if (pollfd[i].revents & POLLHUP) { 
goto hungup; 
} else if (pollfd[i].revents & POLLIN) { 
/* xead argument buffer from client */ 
if ((nread = read(pollfd[i].fd, buf, MAXLINE)) < 0) { 
log sys("read error on fd %d", pollfd[i].fd); 
) else if (nread == 0) { 
hungup: 
/* the client closed the connection */ 
log msg("closed: uid $d, fd $d", 
client[i].uid, pollfd[i]).fd); 
client, del(pollfd[il.fqd); 


17.6 open 服务 器 进程 第 2 版 541 


close(pollfd[i].fd):; 

if (i < (numfd-1)) { 
/* pack the array */ 
pollfd[il].fd = pollfd[numfd-1].fd; 
pollfd[i].events = pollfd[numfd-1].events; 
pollfd[i].revents - pollfd[numfd-1].revents; 
i--; /* recheck this entry */ 

) 

numfd--; 

) else ( /* process client's request */ 
handle request(buf, nread, pollfd[il.fd, 
client[i].uid); 


图 17-30 ”使 用 poll 的 loop 函数 

为 使 打开 描述 符 的 数量 能 与 客户 进程 数量 相当 ， 我 们 动态 地 为 po11fd 结构 的 数字 分 配 空间 ， 
所 使 用 的 策略 与 client_alloc MAAK client 数组 〈 见 图 17-27) 时 所 使 用 的 相同 。 

pollfd 数组 中 的 第 一 个 登记 项 〈 下 标号 为 0) 用 于 1istenfd 描述 符 。 新 客户 进程 连接 的 
到 达 由 listenfd 描述 符 中 的 POLLIN 指示 。 如 同 前 述 ， 调 用 serv accept 来 接受 该 连接 。 

对 于 一 个 现 有 的 客户 进程 ,应 当 处 理 来 自 Pell 的 两 个 不 同事 件 : 由 POLLHUP 指示 的 客户 进程 
终止 ， 由 POLLIN 指示 的 来 自 现 有 客户 进程 的 一 个 新 请 求 。 即 使 连接 的 服务 器 端 还 在 读 取 数据 ， 客 
户 端 也 能 够 关闭 它 这 端的 连接 。 即 使 连接 的 一 端 已 经 被 标记 为 挂 起 状态 ， 服 务 器 仍然 可 以 读 取 在 它 
那 端 队 列 里 的 数据 。 当 然 ， 服 务 器 在 收 到 客户 端的 挂 起 消息 时 用 close 关闭 到 客户 端的 连接 ， 可 有 
效 地 抛弃 所 有 队列 里 的 数据 。 剩 下 的 请 求 也 没 必 要 处 理 ， 因 为 我 们 已 经 无 法 发 回响 应 的 信息 。 

如 同 此 函数 的 select 版 本 ， 调 用 request 函数 〈 见 图 17-31) 处 理 来 自 客户 进程 的 新 请 求 。 
此 函数 类 似 于 其 早期 版 本 〈 见 图 17-22)。 它 调用 同一 函数 buf args (WA 17-23). buf_args 
又 调用 cli args (WR 17-24)， 但 是 ， 因 为 它 是 在 一 个 守护 进程 中 运行 的 ， 所 以 它 在 日 志文 件 
中 记录 出 错 消息 ， 而 不 是 在 标准 错误 上 打印 它们 。 


#include "opend.h" 
#include «fcntl.h» 
void 


handle request(char *buf, int nread, int clifd, uid t uid) 
( 
int newfd; 


if (buf[nread-1] != 0) { 
snprintf(errmsg, MAXLINE-1, 
"request from uid $d not null terminated: %*.*s\n", 
uid, nread, nread, buf); 
send err(clifd, -1, errmsg); 
return; 
) 
log msgí("request: %s, from uid $d", buf, uid); 
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/* parse the arguments, set options */ 
if (buf args(buf, cli args) < 0) { 
send err(clifd, -1, errmsg}; 
log msg(errmsqg); 
return; 


) 


if ((newfd = open{pathname, oflag)) < 0) { 
snprintf(errmsg, MAXLINE-1, "can't open $s: %s\n", 
pathname, strerror(errno)):; 
send err(clifd, -1, errmsg); 
log msg (errmsg); 
return; 
} 


/* send the descriptor */ 
if (send fdí(clifd, newfd) < 0) 
log sys("send fd error"); 
log msg("sent fd %d over fd $d for $s", newfd, clifd, pathname); 
close (newfd); /* we're done with descriptor */ 


17-31 request BR 
这 就 完成 了 open 服务 器 进程 第 2 版 ， 它 仅 使 用 一 个 守护 进程 就 处 理 了 所 有 的 客户 进程 请 求 。 


17.7 ”小结 


本 章 的 关键 点 是 如 何在 两 个 进程 之 闻 传 送 文件 描述 符 ， 以 及 服务 器 进程 如 何 接受 来 自 客户 进 
程 的 唯一 连接 。 虽 然 所 有 平台 都 支持 UNIX 域 套 接 字 〈 见 图 15-1)， 但 是 各 种 实现 都 有 不 同 之 处 ， 
这 使 我 们 很 难 开发 可 移植 的 应 用 程序 。 

整 章 都 使 用 了 UNIX 域 套 接 字 。 我 们 了 解 了 如 何 用 它们 来 实现 一 个 全 双 工 的 管道 以 及 如 何 利 
用 它们 来 适应 14.4 节 的 VO 多 路 转 接 函数 以 间接 地 用 于 XSI 消息 队列 中 。 

本 章 给 出 了 open 服务 器 进程 的 两 个 版 本 。 一 个 版 本 由 客户 进程 用 fork 和 exec 直接 调用 ， 
另 一 版 本 是 一 个 守护 服务 器 进程 处 理 所 有 客户 进程 请 求 。 这 两 个 版 本 均 采 用 文件 描述 符 传 送 和 接 
WC BR BBY 

我 们 还 展示 了 如 何 使 用 getopt 函数 来 保证 命令 行 参数 处 理 的 一 致 性 。 最 终 的 open 服务 器 
进程 版 本 使 用 了 getopt 函数 .17.3 节 中 引入 的 客户 进程 -服务 器 进程 连接 函数 和 14.4 节 中 的 VO 

多 路 转 接 函数 。 


m 


17.1 我 们 选择 使 用 图 17-3 中 的 UNIX 域 数据 报 套 接 字 ， 因 为 它们 能 够 保留 消息 边界 。 描 述 如 果 
使 用 常规 的 管道 实现 需要 哪些 必要 的 改动 。 我 们 应 当 如 何 避 免 额 外 的 两 次 消息 复制 呢 ? 

17.2 使 用 本 章 描 述 的 文件 描述 符 传 送 函数 以 及 8.9 节 中 描述 的 父 进程 和 子 进程 同步 例 程 , 编写 具 
有 下 列 功能 的 程序 。 该 程序 调用 fork， 子 进程 打开 一 个 现 有 的 文件 并 将 打开 文件 描述 符 传 
送 给 父 进程 。 然 后 ， 子 进程 调用 1seek 确定 该 文件 的 当前 读 、 写 位 置 ， 通 知 父 进程 。 父 进 
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程 读 该 文件 的 当前 偏 移 量 ， 并 打印 它 以 便 验证 。 若 此 文件 按 上 述 方式 从 子 进程 传递 到 父 进 
程 ， 则 父 进 程 和 子 进程 应 共享 同一 个 文件 表 项 ， 所 以 当 子 进程 每 次 更 改 该 文件 当前 偏 移 量 
时 ， 这 种 更 改 应 该 也 会 影响 父 进 程 的 描述 符 。 使 子 进程 将 该 文件 定位 至 一 个 不 同 偏 移 量 ， 
并 再 次 通知 父 进 程 。 

17.3 图 17-20 和 图 17-21 中 的 程序 分 别 定义 和 声明 了 全 局 变量 ， 两 者 的 区 别 是 什么 ? 

17.4 改写 buf args BR CLA 17-23)， 删 除 其 中 对 argv 数组 长 度 的 编译 时 限制 。 请 用 动态 
存储 分 配 。 

17.5 描述 优化 图 17-29 和 图 17-30 中 的 loop 函数 的 方法 ， 并 实现 之 。 

17.6 在 serv listen 函数 (WA 17-8) 中 ， 如 果 文 件 已 经 存在 ， 我 们 要 先 对 代表 UNIX RE 
接 字 的 文件 名 解除 链接 。 为 了 防止 误 删除 不 是 套 接 字 的 文件 , 我 们 可 以 先 调用 stat 来 验证 
文件 类 型 。 解 释 这 种 做 法 存在 的 两 个 问题 。 

17.7 请 给 出 两 种 可 能 的 方法 ， 使 得 单 次 调用 sendmsg 可 以 传递 多 个 文件 描述 符 。 尝 试 实现 你 的 
方法 并 验证 你 的 操作 系统 是 否 支持 这 样 的 方法 。 670 





终端 IO 





18.1 引言 


无 论 在 哪 种 操作 系统 中 ， 终 端 VO 的 处 理 都 是 非常 繁琐 的 一 部 分 ，UNIX 系统 也 不 例外 。 在 
大 多 数 版 本 的 编程 手册 中 ， 终 端 VO 手册 页 常常 是 最 长 的 几 个 部 分 之 一 。 

在 20 世纪 70 年 代 后 期 , RAE V7 的 基础 上 发 展 出 一 套 不 同 的 终端 例 程 , 由 此 使 得 UNIX 
终端 IO 处 理 分 立 为 两 种 不 同 的 风格 。 一 种 是 系统 II 的 风格 ， 由 System V 沿 续 下 来 ， 另 一 种 是 
V7 的 风格 ， 它 成 为 BSD 派生 的 系统 终端 VO 处 理 的 标准 。 如 同 信 号 一 样 ，POSIX.1 在 这 两 种 风 
格 的 基础 上 制定 了 终端 VO 标准 。 本 章 将 介绍 POSIX.1 的 所 有 终端 函数 ， 以 及 某 些 平台 特有 的 增 
加 部 分 。 

终端 UO 系统 之 所 以 如 此 复杂 ， 部 分 原因 是 人 们 将 其 应 用 在 众多 的 事物 上 : 终端 、 计 算 机 之 
间 的 直接 连接 、 调 制 解 调 器 以 及 打印 机 等 。 


18.2 综述 


终端 VO 有 两 种 不 同 的 工作 模式 。 

C1) 规范 模式 输入 处 理 。 在 这 种 模式 中 ， 对 终端 输入 以 行为 单位 进行 处 理 。 对 于 每 个 读 请 求 ， 
终端 驱动 程序 最 多 返回 一 行 。 

(2) 非 规范 模式 输入 处 理 。 输 入 字符 不 装配 成 行 。 

如 果 不 做 特殊 处 理 ， 则 默认 模式 是 规范 模式 。 例 如 ， 若 shell 将 标准 输入 重 定 向 到 终端 ， 并 用 
read 和 write 将 标准 输入 复制 到 标准 输出 ， 则 终端 以 规范 模式 进行 工作 ， 每 次 read 最 多 返回 
一 行 。 处 理 整 个 屏幕 的 程序 (如 vi 编辑 器 〉 使 用 非 规 范 模 式 ， 原 因 是 它 的 命令 可 能 是 由 单个 字 
符 组 成 的 ， 并 且 不 以 换行 符 终止 。 另 外 ， 该 编辑 器 并 不 希望 系统 对 特殊 字符 进行 处 理 ， 因 为 这 些 
字符 很 可 能 与 编辑 命令 中 使 用 的 字符 重生 。 DI. CrHD 字符 通常 是 终端 的 文件 结束 符 , 但 在 vi 
中 它 是 向 下 滚动 半 个 屏幕 的 命令 。 

| V7 和 较 早 的 BSD 风格 类 的 终端 驱动 程序 支持 3 种 终端 输入 模式 :( a ) 精细 加 工 模式 《输入 

”装配 成 行 ， 并 对 特殊 字符 进行 处 理 ) (b) 原始 模式 ( 输入 不 装配 成 行 ， 也 不 对 特殊 字符 进行 处 理 ); 

(c) cbreak 模式 (输入 不 装配 成 行 ， 但 对 某 些 特殊 字符 进行 处 理 )。 图 18-20 显示 了 将 终端 设置 为 
cbreak 或 原始 模式 的 POSIX.1 函数 。 


POSIX. 定义 了 11 个 特殊 输入 字符 ， 其 中 9 个 可 以 更 改 。 本 书 已 经 用 到 了 其 中 几 个 ， 例 
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如 文件 结束 符 (通常 是 Ctrl+D) 和 挂 起 字符 〈 通 常 是 Cult+Z). 18.3 节 将 对 这 些 字符 逐一 进行 
说 明 。 
可 以 认为 终端 设备 是 由 通常 位 于 内 核 中 的 终端 驱动 程序 控制 的 。 每 个 终端 设备 都 有 一 个 输入 
队列 和 一 个 输出 队列 ， 如 图 18-1 所 示 。 
进程 写 的 下 一 个 字符 进程 读 的 下 一 个 字符 


= 
| 


| MAX INPUT — — » 
传送 到 设备 的 从 设备 中 读 取 的 
下 一 个 字符 下 一 个 字符 


18-1 终端 设备 的 输入 、 输 出 队列 的 逻辑 结构 

对 此 图 要 说 明 以 下 几 点 。 

。 如 果 打 开 了 回 显 功能 ， 则 在 输入 队列 和 输出 队列 之 间 有 一 个 隐 含 的 连接 。 

。 输入 队列 的 长 度 MAX_INPUT ( 见 图 2-11) 是 有 限 值 。 当 一 个 特定 设备 的 输入 队列 已 经 填 

满 时 ， 系 统 的 行为 将 依赖 于 实现 。 这 种 情况 发 生 时 大 多 数 UNIX 系统 回 显 响 铃 字符 。 
© 图 中 没有 显示 另 一 个 输入 限制 MAX_CANON。 这 个 限制 是 一 个 规范 输入 行 的 最 大 字 
节 数 。 

。 虽然 输出 队列 的 长 度 通常 也 是 有 限 的 ， 但 是 程序 并 不 能 获得 这 个 定义 其 长 度 的 常量 ， 
为 当 输 出 队列 将 要 填 满 时 ， 内 核 便 直接 使 写 进程 休眠 ， 直 至 写 队 列 中 有 可 用 的 空间 。 

。 我 们 将 说 明 如 何 使 用 冲洗 函数 tcflush 冲洗 输入 或 输 用 户 进程 
出 队列 。 与 此 类 似 ， 在 说 明 tcsetattr 函数 时 ， 将 会 
了 解 到 如 何 通 知 系统 只 有 在 输出 队列 为 空 时 ， 才 能 改变 
一 个 终端 的 属性 。( 例 如 ， 想 要 改变 输出 属性 时 就 要 这 样 
做 。) 也 可 以 通知 系统 ， 让 它 在 改变 终端 属性 时 丢弃 输入 
队列 中 的 所 有 东西 。( 如 果 正 在 改变 输入 属性 , 或 者 在 规 
范 模式 和 非 规 范 模式 之 间 进 行 转换 ， 就 需要 这 样 做 ， 以 
免 以 错误 的 模式 对 以 前 输入 的 字符 进行 解释 。) 

大 多 数 UNIX 系统 在 一 个 称 为 终端 行规 程 〈terminal line 
discipline) 的 模块 中 进行 全 部 的 规范 处 理 。 可 以 将 这 个 模块 设想 
成 一 个 盒子 , 位 于 内 核 通 用 读 、 写 函数 和 实际 设备 驱动 程序 之 间 
(HE 18-2). 

由 于 将 规范 处 理 分 离 为 单独 的 模块 ， 所 有 的 终端 驱动 程序 
都 能 够 一 致 地 支持 规范 处 理 , 在 第 19 章 讨论 伪 终 端 时 还 将 使 用 
此 图 。 

所 有 可 以 检测 和 更 改 的 终端 设备 特性 都 包含 在 termios 结 实际 设备 
构 中 。 该 结构 定义 在 头 文件 <termios .h> 中 ， 本 章 使 用 这 一 头 18-2 终端 行规 程 
文件 。 
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struct termios { 


tcflag t c_iflag; /* input flags */ 
tcflag t c oflag; /* output flags */ 
tcflag t c cflag; /* control flags */ 
tcflag t c lflag; /* local flags */ 

cc, t c, cc [NCCS] ; /* control characters */ 


) 


粗略 地 说 ， 和 输入 标志 通过 终端 设备 驱动 程序 控制 字符 的 输入 《例如 ， 剥 除 输入 字 节 的 第 8 位 ， 
允许 输入 奇偶 校 验 )， 输 出 标志 则 控制 驱动 程序 输出 〈 例 如 ， 执 行 输出 处 理 、 将 换行 符 转换 为 
CR/LF)， 控 制 标志 影响 RS-232 串 行 线 〈 例 如 ， 忽 略 调制 解 调 器 的 状态 线 、 每 个 字符 的 一 个 或 两 
个 停止 位 ，， 本 地 标志 影响 驱动 程序 和 用 户 之 间 的 接口 “例如 ， 回 显 打开 或 关闭 、 可 视 地 擦 除 字 
符 、 允 许 终端 产生 的 信和 号 以 及 对 后 台 输 出 的 作业 控制 停止 信号 )。 

类 型 tcflag t 的 长 度 足 以 保存 每 个 标志 值 ， 它 经 常 被 定义 为 unsigned int 或 者 unsigned 
long.c_cc 数组 包含 了 所 有 可 以 更 改 的 特殊 字符 .NCCS 是 该 数组 中 元 素 的 数量 , 其 典型 值 在 15 一 
20〈 因 为 大 多 数 UNIX 实现 支持 的 特殊 字符 都 比 POSIX.1 所 定义 的 10 个 要 多 )。cc_t 类 型 的 长 
度 足以 保存 每 个 特殊 字符 ， 典 型 的 是 unsigned char. 

POSIX 标准 之 前 的 System V 版 本 有 一 个 名 为 <termio.h> 的 头 文 件 和 一 个 名 为 termio HK 
| 据 结构 。 为 了 与 先前 版 本 有 所 区 别 ，POSIX.1 在 这 些 名 字 后 加 了 一 个 s. 


18-3 至 图 18-6 列 出 了 所 有 可 以 更 改 以 影响 终端 设备 特性 的 终端 标志 。 注 意 ， 虽 然 Single 
UNIX Specification 定义 了 供 所 有 平台 启动 所 用 的 公共 子 集 , 但 所 有 实现 都 有 自己 的 扩充 部 分 。 这 
些 扩充 部 分 大 多 来 自 各 系统 之 间 的 历史 差异 。18.5 节 将 对 这 些 标志 值 进行 详细 的 讨论 。 


未 1 FreeBSD Linux MacOSX Solaris 
EATEN di 320 —— 1068 10 


CBAUDEXT 
CCAR_OFLOW 
CCTS_OFLOW 
CDSR_OFLOW 
CDTR_IFLOW 
CIBAUDEXT 
CIGNORE 
CLOCAL 
CMSPAR 
CREAD 
CRTSCTS 
CRTS_IFLOW 
CRTSXOFF 
CSIZE 
CSTOPB 
HUPCL 
MDMBUF 
PARENB 
PAREXT 
PARODD 


扩充 的 波 特 率 

输出 的 DCD 流 控制 
输出 的 CTS 流 控制 
输出 的 DSR 流 控制 
输入 的 DTR 流 控 制 
扩充 输入 波 特 率 

忽略 控制 标志 

忽略 调制 解 调 器 状态 行 
标记 或 空 奇偶 性 

启用 接收 装置 

启用 硬件 流 控制 
输入 的 RTS 流 控制 
启用 输入 硬 忻 流 控 制 
字符 大 小 屏蔽 字 

发 送 两 个 停止 位 , ARE 1 位 
最 后 关闭 时 挂 断 

与 CCAR_OFLOW 相同 
启用 奇偶 校 验 
标记 或 空 奇偶 性 
TRH, ds EOS 


18-3 c cflag 终端 标志 
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* FreeBSD Linux MacOSX Solaris 
pe | wm | poste 8.0 3.2.0 10.6.8 10 


BRKINT | 接 到 BREAK 时 产生 SIGINT 
ICRNL 将 输入 的 CR 转换 为 NL 
IGNBRK | 忽略 BREAK 条 件 

IGNCR 忽略 CR 

IGNPAR | 忽略 奇偶 校 验 出 错 的 字符 
IMAXBEL | 在 输入 队列 满 时 振 铃 


INLCR 将 输入 的 NL 转换 为 CR 

INPCK 打开 输入 奇偶 校 验 

ISTRIP | 剥 除 输入 字符 的 第 8 位 

IUCLC 将 输入 的 大 写字 符 转 换 成 小 写字 符 
IUTF8 输入 是 UTF-8 

IXANY 使 任何 字符 都 重新 启动 输出 
IXOFF 使 启用 /禁用 输入 流 控 制 起 作用 
IXON 使 启用 /禁用 输出 流 控制 起 作用 
PARMRK | 标记 奇偶 检验 错误 


. . e . . e . 
. * LJ . » . * . * 


s * * . e . a . + L] 





» . . . . *. . s . * * . * * . 


18-4 c iflag 终端 标志 


m $ FreeBSD Linux MacOSX Solaris 
oss | o xw (mesi 8.0 3.2.0 10.6.8 10 


ALTWERASE | 使 用 替换 WERASE 算法 
ECHO 启用 回 显 

ECHOCTL 回 显 控制 字符 为 ^ CChar) 
ECHOE 可 视 地 擦 除 字符 

ECHOK 回 显 杀 死 符 

ECHOKE 杀 死 的 可 见 擦 除 

ECHONL In] & NL 

ECHOPRT 硬 拷贝 的 可 见 控 除 方式 
EXTPROC 外 部 字符 处 理 

FLUSHO 冲洗 输出 

ICANON 规范 输入 

IEXTEN 使 扩充 的 输入 字符 处 理 起 作用 
ISIG 使 终端 产生 的 信号 起 作用 
NOFLSH 在 中 断 或 退出 后 不 冲洗 
NOKERNINFO | 无 来 自 STATUS 的 内 核 输出 
PENDIN 重新 键入 未 决 输 入 

TOSTOP 对 于 后 台 输出 发 送 SIGTTOU 
XCASE 规范 的 大 /小 写 表 示 


图 18-5 c lflag 终端 标志 

给 出 了 所 有 可 用 的 选项 后 ， 如 何 才 能 检测 和 更 改 终端 设备 的 这 些 特性 呢 ? 图 18-7 总 结 并 
列 出 了 Single UNIX Specification 所 定义 的 对 终端 设备 进行 操作 的 各 个 函数 。(〈 列 出 的 所 有 函 
数 都 是 POSIX 基本 规范 的 组 成 部 分 。9.7 节 已 说 明了 tcgetpgrp. tcgetsid M tcsetpgrp 
函数 。) 

注意 ， 对 终端 设备 ，Single UNIX Specification 没有 使 用 经 典 的 ioctl, MAHA TA 18-7 
中 列 出 的 13 个 函数 。 这 样 做 的 理由 是 ， 对 于 终端 设备 的 ioctl 函数 ， 其 最 后 一 个 参数 的 数据 类 
型 随 执行 动作 的 不 同 而 改变 。 因 此 ， 不 可 能 对 参数 进行 类 型 检查 。 
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Linux Mac OS X Solaris 
3.2.0 10.6.8 10 


IB ER RS 
CR 延迟 屏蔽 字 
换 页 延迟 屏蔽 字 
NL 延迟 屏蔽 字 
将 输出 的 CR 映射 为 NL 
HARA DEL, FUA NUL 
延迟 使 用 填充 符 
将 输出 的 小 写字 符 映 射 为 大 写字 符 
将 NL 映射 为 CR-NL 
ONLRET | NL 执行 CR 功能 
ONOCR | 在 0 列 不 输出 CR 
ONOEOT | 在 输出 中 丢弃 EOT 字符 OD) 
OPOST | 执行 输出 处 理 
OXTABS | 将 制 表 符 扩充 为 空格 
TABDLY | 水 平 制 表 符 延 迟 屏蔽 字 
VTDLY | 垂直 制 表 符 延 迟 屏蔽 字 


tcgetattr 获取 属性 (termios 结构 ) 
tcsetattr 设置 属性 (termios 结构 ) 
cfgetispeed | 获得 输入 速度 
cfgetospeed | 获得 输出 速度 
cfsetispeed | 设置 输入 速度 
cfsetospeed | 设置 输出 速度 

tcdrain 等 待 所 有 输出 都 被 传输 
tcflow 挂 起 传输 或 接收 

tcflush 冲洗 未 次 输入 和 /或 输出 
tcsendbreak | 发 送 BREAK 字符 
tcgetpgrp 获得 前 台 进 程 组 D 
tcsetpgrp 设置 前 全 进程 组 ID 
tcgetsid 得 到 控制 TTY 的 会 话 首 进程 的 进程 组 ID 


18-7 ”终端 /O 函数 汇总 
虽然 在 终端 设备 上 进行 操作 的 只 有 13 个 函数 ,但 是 图 18-7 中 的 前 两 个 函数 (tcgetattr 
和 tcsetattr) 能 处 理 大 约 70 种 不 同 的 标志 (NA 18-3 至 图 18-6)。 终 端 设 备 有 大 量 选 
项 可 供 使 用 ， 此 外 ， 对 于 某 个 特定 设备 〈 假 设 其 为 终端 、 调 制 解 调 器 、 打 印 机 或 任何 其 他 
设备 )， 决 定 其 需要 哪些 选项 对 我 们 来 说 也 是 一 种 挑战 ， 这 些 都 使 得 对 终端 设备 的 处 理 变 
得 异常 复杂 。 
图 18-7 中 列 出 的 13 个 函数 之 间 的 关系 如 图 18-8 所 示 。 


i POSIX. 没有 指定 将 波 特 率 信息 存储 在 termios 结构 中 的 什么 地 方 ， 它 依赖 于 实现 的 细节 。 
| ERR, t Solaris， 将 此 信息 存储 在 c_cflag 字段 中 。Linux 和 BSD 派生 的 系统 ， 如 FreeBSD 
和 Mac OSX， 则 在 此 结构 中 有 两 个 分 开 的 字段 一 个 存储 输入 速度 ， 另 一 个 存储 输出 速度 。 
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"a T 
a o 
v o 
pu 位 
a n 
r1 "d 
# + 
9 o 
a tm 
WH H 
o o 


cfsetospeed 
cfgetospeed 


struct 
termios 








行 控制 函数 前 台 进 程 组 ID 
He 
h hj 9 el s * "y |E " 
p H m d a} 68 a Do j| 
a g 2a s at 3 5 |& JA 
+ HJ "à H rt ul v + v 
o v | 9| *"| o Db 9 ET 
n e 9 0 of p e w | 四 
Q 0 ^| 2| + D Q u 
p 出 hd "m 
终端 行规 程 / 终端 设备 驱动 程序 
图 18-8 ”与 终端 有 关 的 各 函数 之 间 的 关系 677 


18.3 ”特殊 输入 字符 


POSIX.1 定义 了 11 个 在 输入 时 要 特殊 处 理 的 字符 。 实 现 定义 了 另外 - - 些 特殊 字符 。 图 18-9 
总 结 并 列 出 了 这 些 特殊 字符 。 


FreeBSD Linux MacOS Solaris 
8.0 320 X10.68 10 


(不 能 更 改 ) |c_lflag 
VDISCARD c lflag 


VDSUSP c lflag 


c lflag 
c lflag 
c lflag 
c lflaq 
C lflag 


c lflag 


c_iflag 
下 一 个 字符 的 字 |VLNEXT c lflag 
面值 


换行 (不 能 更 改 ) |c_lflag 

退出 信号 VQUIT c lflag 
(SIGQUIT) 

再 打印 全 部 输入 |VREPRINT  |c lflag 

恢复 输出 VSTART c iflag 
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8.0 320 X1068 10 


(SIGTSTP) 
WERASE | 向 前 擦 除 一 个 字 |VWERASE 


图 18-9 终端 特殊 输入 字符 汇总 《 续 ) 


在 POSIX.1 的 11 个 特殊 字符 中 ， 其 中 有 9 个 字符 的 值 可 以 任意 更 改 。 不 能 更 改 的 两 个 特殊 
字符 是 换行 符 和 回 车 符 ( 分 别 是 \n 和 \r)， 也 可 能 是 STOP 和 START FF KATER) HT 
更 改 ， 只 需要 修改 termios 结构 中 c_cc 数组 的 相应 项 。 该 数组 中 的 元 素 都 用 名 字 作 为 下 标 进 
行 引 用 ， 每 个 名 字 都 以 字母 V 开头 〈 见 图 18-9 中 的 第 3 列 )。 
POSIX.1 允许 禁止 使 用 这 些 字符 。 若 将 c_cc 数组 中 的 某 项 设置 为 _ POSIX_VDISABLE KYA, 
则 禁止 使 用 相应 特殊 字符 。 
| 在 Single UNIX Specification 的 早期 版 本 中 ， 支 持 POSIX VDISABLE 是 可 选项 ， 现 在 则 是 必 选 项 。 
本 书 讨论 的 4 种 平台 都 支持 此 特性 。Linux 32.0 和 Solaris 10 将 _POSIX_VDISABLE 定义 为 0， 而 
| FreeBSD 8.0 和 Mac OS X 10.6.8 则 将 其 定义 为 0xff。 

某 些 早期 的 UNIX 系统 所 用 的 方法 是 : 藻 与 某 一 特性 相应 的 特殊 输入 字符 是 0， 则 禁止 使 用 该 特性 。 





i 


"a ch 
在 详细 说 明 各 特殊 字符 之 前 ， 先 看 一 个 更 改 特殊 字符 的 小 程序 。 图 18-10 所 示 的 程序 禁用 中 
断 字符 ， 并 将 文件 结束 符 设置 为 Ctrl+B。 


#include "apue.h" 
#include «termios.h» 


int 
main(void) 


{ 


struct termios term; 
long vdisable; 
if (isatty(STDIN FILENO) == 0) 


err quit("standard input is not a terminal device"); 


if ((vdisable = fpathconf(STDIN FILENO, PC VDISABLE)) < 0) 
err quit("fpathconf error or POSIX VDISABLE not in effect"); 


if (tcgetattr(STDIN FILENO, &term) < 0) /* fetch tty state */ 
err sys("tcgetattr error"); 


term.c cc[VINTR] = vdisable; /* disable INTR character */ 
term.c cc[VEOF] = 2; /* EOF is Control-B */ 


if (tcsetattr(STDIN FILENO, TCSAFLUSH, &term) < 0) 
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err sys("tcsetattr error"); 


exit(0); 


18-10 ”禁用 中 其 字符 并 更 改 文件 结束 符 


对 此 程序 要 说 明 以 下 几 点 。 
© 仅 当 标准 输入 是 终端 设备 时 才 修 改 终 端 特殊 字符 。 调 用 isatty〔 见 18.9 节 ) 对 此 进行 检测 。 
e 用 fpathconf 获取 _POSIX_VDISABLE fü. 
e BMMtcgetattr (A 18.4 节 ) 从 内 核 获取 termios 结构 。 在 修改 了 此 结构 后 ， 调 
用 tcsetattr 函数 设置 属性 ， 只 有 我 们 所 希望 修改 的 属性 被 更 改 了 ， 而 其 他 属性 保 
持 不 变 。 
。 禁用 中 断 键 与 忽略 中 断 信 号 是 不 同 的 。 图 18-10 中 的 程序 所 做 的 只 是 禁用 使 终端 驱动 程序 
产生 SIGINT 信和 号 的 特殊 字符 。 我 们 仍 可 使 用 kill 函数 将 该 信号 发 送 至 进程 。 WW [679 
下 面 较 详 细 地 说 明 各 个 特殊 字符 。 我 们 称 这 些 字符 为 特殊 输入 字符 ， 但 是 其 中 有 两 个 字 

符 一 一 STOP 和 START (Ctri+S 和 Ctrl+Q)， 在 输出 时 也 要 进行 特殊 处 理 。 注 意 ， 这 些 字符 中 的 大 

多 数 在 被 终端 驱动 程序 识别 并 进行 特殊 处 理 后 会 被 丢弃 ， 并 不 将 它们 返回 给 执行 读 终端 操作 的 进 

程 。 返 回 给 读 进 程 的 例外 字符 是 换行 符 CNL. EOL. EOL2) 和 回 车 符 (CR)。 

CR 回 车 符 。 不 能 更 改 此 字符 。 以 规范 模式 进行 输入 时 识别 此 字符 。 在 已 设置 ICANON 
(规范 模式 ) 和 ICRNL (将 CR 映射 为 NL) 但 并 未 设置 IGNCR (忽略 CR) 时 ，CR 
字符 会 被 转换 成 NL， 并 具有 与 NL 字符 相同 的 作用 。 此 字符 返回 给 读 进 程 〈 很 可 
能 是 在 转换 为 NL 之 后 )。 

DISCARD EFR. EF ARA (EXTEN) 下 进行 输入 时 识别 此 字符 。 在 输入 另 一 个 DISCARD 
字符 之 前 或 在 丢弃 条 件 被 清除 之 前 ( 见 FLUSHO 选项 )， 此 字符 使 后 续 输 出 都 被 丢 
弃 。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进程 )。 

DSUSP 延迟 挂 起 作业 控制 字符 (delayed-suspend job-control character). 。 在 扩充 模式 
(IEXTEN) 下 ， 若 支持 作业 控制 ， 并 且 已 设置 ISIG 标志 ， 则 在 输入 时 识别 此 字符 。 
与 SUSP 字符 的 相同 之 处 是 :延迟 挂 起 字符 产生 SIGTSTP 信和 号， 该 信号 被 发 送 至 
前 台 进 程 组 中 的 所 有 进程 ( 见 图 9-7)。 但 是 ， 信 和 号 产生 的 时 间 并 不 是 在 键入 延迟 挂 
起 字符 之 时 ， 而 是 在 某 个 进程 从 控制 终端 读 到 此 字符 时 才 产 生 。 此 字符 在 处 理 后 即 
被 丢弃 〈 即 不 传送 给 读 进程 )。 

EOF 文件 结束 符 。 以 规范 模式 (ICANON) 进行 输入 时 识别 此 字符 。 当 键入 此 字符 时 ， 
等 待 被 读 的 所 有 字 节 都 被 立即 传送 给 读 进程 。 如 果 没 有 字 节 等 待 读 ， 则 返回 0。 在 
行 首 输入 一 个 EOF 字符 是 向 程序 指示 文件 结束 的 正常 方式 。 此 字符 在 规范 模式 下 
处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进 程 )。 

EOL 附加 的 行 定 界 符 ， 与 NL 作用 相同 。 以 规范 模式 CICANON) 进行 输入 时 识别 此 字 
符 ， 并 将 此 字符 返回 给 读 进程 。 但 是 此 字符 不 常用 。 

EOL2 另 一 个 行 定 界 符 ， 与 NL 作用 相同 。 对 此 字符 的 处 理 方式 与 EOL 字符 相同 。 

ERASE 向 前 擦 除 字 符 ( 退 格 )。 以 规范 模式 (ICANON) 输入 时 识别 此 字符 。 它 擦 除 行 中 的 
前 一 个 字符 ,但 不 会 超越 行 首 字符 擦 除 上 一 行 中 的 字符 。 此 字符 在 规范 模式 下 处 理 
REF CHAMBERS EEF). 680 
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ERASE2 
INTR 


LNEXT 


REPRINT 


START 


STOP 


SUSP 


供 蔡 换 的 向 前 擦 除 字符 ( 退 格 )。 对 此 字符 的 处 理 与 向 前 擦 除 字符 “ERASE) 完全 相同 。 
RSA. FORE TSIG 标志 ， 则 在 输入 中 识别 此 字符 。 它 产生 SIGINT 信和 号， 

该 信号 被 送 至 前 台 进 程 组 中 的 所 有 进程 ( 见 图 9-7)。 此 字符 在 处 理 后 即 被 丢弃 ( 即 
不 传送 给 读 进 程 )。 

杀 死 字符 。( 名 字 “ 杀 死 ” 在 这 里 又 一 次 被 误 用 ，kil11l 函数 是 用 来 将 某 一 信号 发 
送 给 进程 的 ， 而 此 字符 应 被 称 为 行 擦 除 符 ， 它 与 信号 毫 无 关系 。) 以 规范 模式 
CICANON) 输入 时 识别 此 字符 。 它 擦 除 一 整 行 ， 并 在 处 理 后 即 被 丢弃 〈 即 不 传送 
给 读 进 程 )。 

下 一 个 字符 的 字面 值 (literal-next character)。 以 扩充 方式 CIEXTENO 输入 时 识别 
此 字符 ， 它 使 下 一 个 字符 的 任何 特殊 含意 都 被 忽略 。 这 对 本 节 提 及 的 所 有 特殊 字符 
都 起 作用 。 使 用 这 一 字符 可 向 程序 键入 任何 字符 。LNEXT 字符 在 处 理 后 即 被 丢弃 ， 
但 输入 的 下 一 个 字符 被 传送 给 读 进程 。 

换行 字符 ， 也 被 称 为 行 定 界 符 。 不 能 更 改 此 字符 。 以 规范 模式 CICANONO 输入 时 
识别 此 字符 。 此 字符 返回 给 读 进 程 。 

退出 字符 。 若 已 设置 TSTG 标志 ， 则 在 输入 中 识别 此 字符 。 它 产生 SIGQUIT 信和 号 ， 

该 信号 又 被 送 至 前 台 进 程 组 中 的 所 有 进程 〈 见 图 9-7)。 此 字符 在 处 理 后 即 被 丢弃 
( 即 不 传送 给 读 进程 )。 

回忆 图 10-1, INTR 和 QUIT 的 区 别 是 ，QUIT 字符 不 仅 按 歌 认 规 则 终止 进程 ， 而 且 
还 产生 一 个 core 文件 。 

再 打印 字符 。 以 扩充 规范 模式 《设置 了 IEXTEN 和 ICANON 标志 ) 进行 输入 时 识别 此 
字符 。 它 使 所 有 未 读 的 输入 被 输出 (再 回 显 )。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传 
送 给 读 进程 )。 

启动 字符 。 若 已 设置 IXON 标志 ， 则 在 输入 中 识别 此 字符 。 若 已 设置 IXOFF 标志 ， 
则 自动 产生 此 字符 作为 输出 。 已 设置 IXON 时 ， 接 收 到 的 START 字符 使 停止 的 输 
出 (由 以 前 输入 的 STOP 字符 造成 ) 重新 咎 动 。 在 此 情形 下 ， 此 字符 在 处 理 后 即 被 
丢弃 ( 即 不 传送 给 读 进 程 )。 

已 设置 IXOFF 标志 时 ， 若 新 的 输入 不 会 使 输入 缓冲 区 溢出 ， 则 终端 驱动 程序 自动 
产生 一 个 START 字符 来 恢复 以 前 被 停止 的 输入 。 

BSD 的 状态 请 求 字符 。 以 扩充 规范 模式 (设置 了 IEXTEN 和 ICANON 标志 ) 进行 输入 
时 识别 此 字符 。 它 产生 SIGINFO 信号 ， 该 信号 又 被 送 至 前 台 进程 组 中 的 所 有 进程 
( 见 图 9-7)。 另 外 ， 如 果 没 有 设置 NOKERNINFO 标志 ， 则 有 关 前 台 进 程 组 的 状态 信 
息 也 显示 在 终端 上 。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进 程 )。 

停止 字符 。 若 已 设置 IXON 标志 ， 则 在 输入 中 识别 此 字符 。 若 已 设置 I[XOFF 标志 ， 
则 自动 产生 此 字符 作为 输出 。 已 设置 TIXON 时 ， 接 收 到 STOP 字符 则 停止 输出 。 在 
此 情形 下 ， 些 字符 在 处 理 后 即 被 竺 弃 《〈 即 不 传送 给 读 进 程 )。 当 输入 一 个 START F 
符 后， 被 停止 的 输出 重新 启动 。 

已 设置 IXOFF 时 ， 终 端 驱动 程序 自动 产生 一 个 STOP 字符 以 防止 输入 缓冲 区 溢出 。 

挂 起 作业 控制 字符 。 车 支持 作业 控制 并 且 已 设置 TSIG 标志 ， 则 在 输入 中 识别 此 字 
符 。 它 产生 SIGTSTP 信号 ,该 信号 又 被 送 至 前 台 进 程 组 的 所 有 进程 ( 见 图 9-7)。 此 
字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进 程 )。 


18.4 获得 和 设置 终端 属性 553 


WERASE ” 字 擦 除 字 符 。 以 扩充 规范 模式 (设置 了 TEXTEN 和 ICANON 标志 ) 进行 输入 时 识别 
此 字符 。 它 使 前 一 个 字 被 擦 除 。 首 先 ， 它 向 前 跳 过 任意 一 个 空白 字符 (空格 或 制 表 
符 )， 然 后 再 向 前 跃 过 前 一 记号 ， 使 光标 处 在 前 一 个 记号 的 第 一 个 字符 位 置 上 。 通 
常 ， 前 一 个 记号 在 磁 到 一 个 空白 字符 时 即 终 止 。 但是， 可 通过 设置 ALTWERASE 标 
记 来 改变 这 个 行为 。 此 标志 使 前 一 个 记号 在 碰 到 第 一 个 非 字母 、 非 数字 字符 时 即 终 
止 。 此 字符 在 处 理 后 即 被 丢弃 〈 即 不 传送 给 读 进 程 )。 

需要 为 终端 设备 定义 的 另 一 个 “字符 ”是 BREAK 字符 。BREAK 实际 上 并 不 是 一 个 字符 ， 
而 是 在 异步 串 行 数据 传送 时 发 生 的 一 个 条 件 。 和 根 据 串 行 接口 的 不 同 ， 可 以 有 多 种 方式 通知 设备 驱 
动 程序 发 生 了 BREAK 条 件 。 


大 多 数 早期 的 串 行 终端 都 有 一 个 标记 为 BREAK 的 键 ， 用 其 可 以 产生 BREAK 条 件 ， 这 就 是 
”为 什么 大 多 数 人 认为 BREAK 就 是 一 个 字符 的 原因 。 某 些 较 新 的 终端 键盘 没有 BREAK St, 4 PC 
| E, BREAK 键 可 能 有 其 他 用 途 。 例 如 ， 键 入 Ctrl+BREAK 可 中 断 Windows 命令 解释 器 。 


对 于 异步 串 行 数据 传送 ，BREAK 是 一 个 0 值 的 位 序列 ， 其 持续 时 间 长 于 要 求 发 送 一 个 字 节 的 时 间 。 
整个 0 值 位 序列 被 视 为 是 一 个 BREAK。18.8 节 将 说 明 如 何 用 tcsendbreak 函数 发 送 一 个 BREAK。 


18.4 ”获得 和 设置 终端 属性 


为 了 获得 和 设置 termios 结构 ， 可 以 调用 tcgetattr 和 tcsetattr 函数 。 这 样 就 可 以 
检测 和 修改 各 种 终端 选项 标志 和 特殊 字符 ， 使 终端 按 我 们 所 希望 的 方式 进行 操作 。 


#include <termios.h> 


int tcgetattr(int fd, struct termios *fermptr); 


int tcsetattr(int fd, int opt, const struct termios *tfermptr) ; 


两 个 函数 的 返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


这 两 个 函数 都 有 一 个 指向 termios 结构 的 指针 作为 其 参数 ， 它 们 或 者 返回 当前 终端 的 属性 ， 
或 者 设置 该 终端 的 属性 。 因 为 这 两 个 函数 只 对 终端 设备 进行 操作 ,所 以 若 启 没有 引用 终端 设备 则 
出 错 返回 -1，errno 设置 为 ENOTTY。 

tcsetattr 的 参数 opt 使 我 们 可 以 指定 在 什么 时 候 新 的 终端 属性 才 起 作用 。opi 可 以 指定 为 
下 列 常量 中 的 一 个 。 

TCSANOW WAR. 

TCSADRAIN 发送 了 所 有 输出 后 更 改 才 发 生 。 若 更 改 输出 参数 则 应 使 用 此 选项 。 

TCSAFLUSH 发 送 了 所 有 输出 后 更 改 才 发 生 。 更 进一步 ， 在 更 改 发 生 时 未 读 的 所 有 输入 数 

据 都 被 丢弃 《冲洗 )。 

Tcsetattr 函数 的 返回 状态 在 使 用 时 易 产 生 混淆 。 如 果 它 执行 了 任意 一 种 所 要 求 的 动作 ， 
即使 未 能 执行 所 有 要 求 的 动作 ， 它 也 返回 OK 〈 表 示 成 功 )。 如 果 该 函数 返回 OK， 则 我 们 有 责任 
检查 该 函数 是 否 执 行 了 所 有 要 求 的 动作 。 这 就 意味 着 , 在 调用 tcsetattz 设置 所 希望 的 属性 后 ， 
需 调 用 tcgetattr， 然 后 将 实际 终端 属性 与 所 希望 的 属性 相 比较 ， 以 检测 两 者 是 否 有 区 别 。 

在 终端 第 一 次 被 打开 时 ， 其 属性 视 具体 情况 而 定 。 一 些 系统 可 能 会 将 终端 属性 初始 化 为 具体 
实现 所 定义 的 值 ， 另 一 些 系 统 可 能 会 保留 并 使 用 最 后 一 次 使 用 终端 时 的 属性 值 。 通 过 打开 一 个 带 
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^ o TTY INIT 标志 〈 见 3.3 50 的 驱动 设备 ， 可 以 确认 终端 的 行为 是 否 遵 循 标准 ， 这 样 就 能 在 
调用 tcgetattr 时 ， 确 保 初 始 化 termios 结构 中 的 任何 非 标准 部 分 ， 使 得 在 修改 属性 和 调用 
tcgetattr 时 ， 终 端的 表现 符合 预期 。 


18.5 终端 选项 标志 


本 节 将 列 出 所 有 不 同 的 终端 选项 标志 ， 扩 展 图 18-3 至 图 18-6 中 的 说 明 。 我 们 将 按 字母 顺序 列 
出 各 个 选项 并 指出 每 个 选项 出 现在 4 个 终端 标志 字段 中 的 哪 一 个 。( 从 选项 名 字 中 看 不 出 它 所 处 的 

字段 。) 还 将 说 明 每 个 选项 是 否 是 Single UNIX Specification 定义 的 ， 并 列 出 了 支持 该 选项 的 平台 。 

列 出 的 所 有 选项 标志 《〈 除 所 谓 的 屏蔽 字 标 志 外 ) 都 用 一 位 或 多 位 〈 设 置 或 清除 ) 表示 。 屏 项 
字 标 志 定 义 多 个 位 ， 它 们 组 合 在 一 起 ， 可 以 定义 一 组 值 。 屏 蔽 字 标 志 有 一 个 定义 名 ， 每 个 值 也 有 
一 个 名 字 。 例 如 ， 为 了 设置 字符 长 度 ， 首 先 用 字符 长 度 屏 项 字 标 志 CSIZE 将 表示 字符 长 度 的 位 
清 0， 然 后 设置 下 列 值 之 一 : CS5、CS6、CS7 或 CS8。 

由 Linux 和 Solaris 支持 的 6 个 延迟 值 也 有 屏蔽 字 标 志 : BSDLY、CRDLY、FFDLY、NLDLY、 
TABDLY 和 VTDLY。 对 于 每 个 延迟 值 的 长 度 请 参阅 Solaris 中 的 termio (7D 手册 页 。 在 所 有 情况 
下 ， 延 迟 屏 蔽 字 为 0 就 表示 没有 延迟 。 如 果 指 定 了 延迟 ， 则 由 OFILL 和 OFDEL 标志 决定 是 由 驱 
动 器 进行 实际 延迟 还 是 只 传输 填充 字符 。 


时 实例 
图 18-11 演示 了 如 何 使 用 这 些 屏 蔽 字 标 志 取 一 个 值 或 者 设置 一 个 值 。 


#include “apue.h" 
#include <termios.h> 


int 
main (void) 
{ 
struct termios term; 


if (tcgetattr(STDIN_FILENO, &term) < 0) 
err sys("tcgetattr error"); 


switch (term.c cflag & CSIZE) í 
case CS5: 
printf("S bits/byteMn") ; 
break; 
case CS6: 
printf("6 bits/byte\n"); 
break; 
case CS7: 
printf("7 bits/byte\n") ; 
break; 
case CS8: 
printf("8 bits/byte\n"); 
break; 
default: 
printf ("unknown bits/byte\n"); 


— 
- 


— 


— 


} 
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term.c cflag &- -CSIZE; /* zero out the bits */ 
term.c cflag |= CS8; /* set 8 bits/byte */ 
if (tcsetattr(STDIN FILENO, TCSANOW, &term) < 0) 

err sys("tcsetattr error"); 


exit (0); 

} 

Pl 18-11 tcgetattr Ñ tcsetattr 实例 "y 
下 面 说 明 各 选项 标志 。 

ALTWERASE (c_lflag, FreeBSD. MacOSX) 已 设置 此 标志 时 ， 若 输入 WERASE 字符 ， 
则 使 用 一 个 替换 的 字 擦 除 算法 。 它 不 是 向 前 移动 到 前 一 个 空白 字符 为 止 ， 而 是 
向 前 移动 到 第 一 个 非 字 母 、 非 数字 字符 为 止 。 

BRKINT (c_iflag，POSIX.1、FreeBSD、Linux、Mac OS X. Solaris) 若 已 设置 此 标志 ， 
而 未 设置 IGNBRK， 则 在 接 到 BREAK 时 ， 冲 洗 输入 、 输 出 队列 ， 并 产生 一 个 
SIGINT 信号 。 如 果 此 终端 设备 是 一 个 控制 终端 ， 则 此 信和 号 就 是 为 前 台 进 程 组 
产生 的 。 

者 未 设置 TGNBRK 和 BRKINT， 但 是 设置 了 PARMRK， 则 BREAK 被 读 作 一 个 
3 字 节 序列 \377、\0 和 \0: 若 也 未 设置 PARMRK， 则 BREAK 被 读 作 单个 字 
符 \0。 

BSDLY (c oflag, XSI. Linux. Solaris) 退 格 延迟 屏蔽 字 。 此 屏蔽 字 的 值 是 BS0 BR BS1. 

CBAUDEXT (c cflag, Solaris) 扩充 的 波 特 率 。 用 于 允许 大 于 B38400 的 波 特 率 。( 将 在 
18.7 节 讨论 波 特 率 。) 

CCAR OFLOW (c_cflag, FreeBSD. Mac OS X) 使 用 RS-232 调制 解 调 器 DCD (Data-Carrier- 
Detect， 数 据 载 波 检测 ) 信号 打开 输出 的 硬件 流 控制 。 这 与 早期 的 MPMBUF 标志 
相同 。 

CCTS OFLOW (c cflag, FreeBSD. MacOS X. Solaris) 使 用 RS-232 CTS (Clear-To-Send, 
清除 发 送 ) 信和 号 打开 输出 的 硬件 流 控制 。 

CDSR OFLOW (c cflag, FreeBSD. Mac OS X) 根据 RS-232 DSR (Data-Set-Ready， 数 据 准 
SOA) 信和 号 进行 输出 的 流 控制 。 

CDTR IFLOW (c cflag, FreeBSD, Mac OS X) 根据 RS-232 DTR (Data-Terminal-Ready, 
数据 终端 就 绪 ) 信号 进行 输入 的 流 控制 。 

CIBAUDEXT (c_cflag, Solaris) 扩充 的 输入 波 特 率 。 用 于 允许 大 于 B38400 的 输入 波 特 率 。 
(将 在 18.7 节 讨 论 波 特 率 。) 

CIGNORE (c_cflag, FreeBSD. MacOSX) 忽略 控制 标志 。 

CLOCAL (c, cflag, POSIX.l. FreeBSD. Linux. Mac OS X. Solaris) FRE, WZ 
略 调制 解 调 器 状态 线 。 这 通常 意味 着 该 设备 是 直接 连接 的 。 例 如 ， 者 未 设置 
此 标志 ， 则 打开 一 个 终端 设备 常常 会 遭遇 阻塞 ， 直 到 调制 解 调 器 回应 呼叫 并 
建立 连接 。 

CMSPAR (c oflag. Linux) 选择 标记 或 空 奇偶 校 验 。 若 已 设置 PRRODD， 则 奇偶 校 验 


位 总 是 1 (标记 奇偶 校 验 )。 否 则 奇偶 校 验 位 总 是 ETARE). 
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CRDLY 


CREAD 


CRTSCTS 


CRTS IFLOW 


CRTSXOFF 


CSIZE 


CSTOPB 


ECHO 


ECHOCTL 


ECHOE 


ECHOK 


(c oflag, XSI. Linux. Solaris) 回 车 延迟 屏蔽 字 。 此 屏蔽 字 的 可 能 值 是 CR0、 
CR1. CR2 和 CR3。 

(c_cflag, POSIX.1, FreeBSD. Linux. Mac OS X. Solaris) ZEE, MHK 
者 被 启用 ， 可 以 接收 字符 。 

(c_cflag, FreeBSD, Linux, Mac OS X. Solaris) 其 行为 依赖 于 平台 。 对 于 
Solaris， 若 设置 该 标志 ， 则 人 允许 带 外 硬件 流 控制 。 在 另外 3 个 平台 上 ， 则 既 允 
许 带 内 硬件 流 控制 ， 又 允许 带 外 硬件 流 控制 (等 价 于 CCTS_OFLOW|CRTS_ 
IFLOW). 

(c_cflag, FreeBSD. MacOS X, Solaris) 输入 的 RTS (Request-To-Send, if 
求 发 送 ) 流 控 制 。 

(c cflag, Solaris) 车 设置 ， 则 允许 带 内 硬件 流 控制 ，RS-232 RTS 信号 的 状态 
控制 了 流 控制 。 

(c_cflag, POSIX.1. FreeBSD. Linux. Mac OS X. Solaris) 此 字段 是 一 个 屏 
项 字 标 志 ， 它 指定 发 送 和 接收 的 每 个 字 节 的 位 数 。 此 长 度 不 包括 可 能 有 的 奇偶 
校 验 位 。 由 此 屏蔽 字 定 义 的 字段 值 是 CS5, CS6, CS7 和 cs8， 分 别 表 示 每 个 
字 节 包含 5 位 、6 位 、7 位 和 8 位 。 

(c_cflag, POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 若 设置 ， 则 使 用 
两 个 停止 位 ， 否 则 只 使 用 一 个 停止 位 。 

(c lflag, POSIX.1、FreeBSD、Linux、Mac OS X, Solaris) BREA, MH 
入 字符 回 显 到 终端 设备 。 在 规范 模式 和 非 规范 模式 下 都 可 以 回 显 输入 字符 。 
(c_lflag, FreeBSD. Linux. Mac OS X. Solaris) 若 设置 并 且 也 设置 EcHO， 
则 除 ASCI TAB, ASCII NL 以 及 START 和 STOP 字符 外 ， 其 他 ASCH 控制 字 
符 (ASCI 字符 集中 0 至 八进制 37 对 应 的 字符 ) BRA AY, 其 中 , x RB 
应 控制 字符 加 上 八进制 100 所 构成 的 字符 。 例 如 ，ASCIH Ctrl+A 字符 (八进制 1) 
被 回 显 为 ^ 人 A。ASCII DELETE FR OVAA 177) 则 回 显 为 ^?。 若 未 设置 此 标 
志 ， 则 ASCII 控制 字符 按 其 原样 回 显 。 如 同 ECHO 标志 ， 在 规范 模式 和 非 规范 
模式 下 ， 此 标志 对 控制 字符 回 显 都 起 作用 。 

应 当 了 解 的 是 , 某 些 系 统 以 不 同方 式 回 显 EOF 字符, 因为 EOF 的 典型 值 是 Ctrli+D 
《而 Ctrl+D Æ ASCI EOT 字符 ， 它 可 能 使 某 些 终端 挂 断 )。 请 查看 有 关 手 册 。 
(c lflag, POSIX.l. FreeBSD. Linux, Mac OS X, Solaris) 若 设置 并 且 也 设 
H ICANON, lll] ERASE 字符 从 显示 中 擦 除 当前 行 中 的 最 后 一 个 字符 。 这 通常 是 
在 终端 驱动 程序 中 写 一 个 3 字符 序列 实现 的 ， 该 序列 是 : 退 格 、 空 格 、 退 格 。 
若 支持 WERASE 字符 ， 则 ECHOE 用 一 个 或 若干 个 上 述 3 字符 序列 擦 除 前 一 个 字 。 
车 支持 ECHOPRT 标志 ， 则 这 里 说 明 的 关于 ECHOE 的 动作 是 在 假定 未 设置 
ECHOPRT 标志 的 条 件 下 得 出 的 。 

(c_lflag, POSIX.l. FreeBSD. Linux. Mac OS X. Solaris) 若 设置 并 且 也 设 
置 ICANON, Jil] KILL 字符 从 显示 中 擦 除 当 前 行 ， 或 者 输出 NL 字符 (用 以 强调 
己 擦 除 整 个 行 )。 

车 支持 ECHOKE 标志 , 则 关于 ECHOK 的 说 明 是 在 假定 未 设置 ECHOKE 标志 的 条 
件 下 得 出 的 。 


ECHOKE 


ECHONL 


ECHOPRT 


EXTPROC 


FFDLY 
FLUSHO 


HUPCL 


ICANON 


ICRNL 


IEXTEN 


IGNBRK 


IGNCR 


IGNPAR 


IMAXBEL 
INLCR 
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(c lflag, FreeBSD. Linux. Mac OS X, Solaris) 若 设置 并 且 也 设置 ICANON, 

WEE KLL 字符 的 方式 是 擦 除 行 中 的 每 一 个 字符 。 擦 除 每 个 字符 的 方法 则 由 
ECHOE 和 ECHOPRT 标志 选择 。 

(c_lflag, POSIX.l. FreeBSD. Linux. Mac OS X. Solaris) 车 设置 并 且 也 设 
E ICANON， 即 使 没有 设置 ECHO， 也 回 显 NL 字符 。 

(c lflag, FreeBSD, Linux. Mac OS X. Solaris) 若 设置 并 且 也 设置 ICANON 
和 ECHO, M) ERASE 字符 (以 及 WERASE 字符 ， 若 受到 支持 ) 使 所 有 正 被 擦 
除 的 字符 按 它 们 被 探 除 的 方式 被 打印 。 这 一 方法 常 在 硬 拷贝 终端 上 显示 其 作用 ， 

它 可 以 使 我 们 确切 地 看 到 哪些 字符 正 被 删除 。 

(c lflag, FreeBSD. Linux. Mac OS X) 若 设置 ， 规 范 字符 处 理 在 操作 系统 
之 外 执行 。 如 果 串 行 通信 外 设 卡 能 够 通过 执行 某 些 行规 程 处 理 减 轻 主机 处 理 器 
负载 ， 那 么 就 可 以 这 样 设 置 。 在 使 用 伪 终 端 时 〈 见 第 19 章 )， 也 可 以 这 样 设 置 。 
(c oflag, XSI. Linux, Solaris) 换 页 延迟 屏蔽 字 。 此 屏 项 字 标 志 值 是 FF0 或 FF1。 
(c, lflag, FreeBSD. Linux. Mac OS X, Solaris) 若 设置 ， 则 冲洗 输出 。 当 
键入 DISCARD 字符 时 设置 此 标志 。 当 键入 另 一 个 DISCARD 字符 时 ， 此 标志 
被 清除 。 可 以 通过 设置 或 清除 此 终端 标志 来 设置 或 清除 此 条 件 。 

(c cflag. POSIX.1, FreeBSD, Linux, Mac OS X, Solaris) 若 设置 ， 则 当 最 
后 一 个 进程 关闭 设备 时 ， 调 制 解 调 器 控制 线 降 至 低 电 平 〈 也 就 是 调制 解 调 器 的 
连接 断 开 )。 

(c_lflag, POSIX.1. FreeBSD. Linux. Mac OS X. Solaris) 若 设置 ， 则 按 规 
范 模式 工作 〈 见 18.10 节 )。 这 使 下 列 字符 起 作用 ，EOF、EOL、EOL2、ERASE、 

KILL. REPRINT. STATUS 和 WERASE。 输 入 字符 被 装配 成 行 。 

如 果 不 以 规范 模式 工作 ， 则 读 请 求 直接 从 输入 队列 取 字符 。 在 至 少 接 到 MIN 个 字 
节 或 两 个 字 节 之 间 的 超时 值 TIME 到 期 时 ，read 才 返 回 。 详 细 情 况 参见 18.11 节 。 
(c_iflag, POSIX.1, FreeBSD. Linux. Mac OS X, Solaris) 若 设置 并 且 未 设 
置 TGNCR， 则 将 接收 到 的 CR 字符 转换 成 NL 字符 。 

(c_lflag, POSIX.1, FreeBSD, Linux, Mac OS X. Solaris) 若 设置 ， 则 识别 
并 处 理 扩展 的 、 由 实现 定义 的 特殊 字符 。 

(c iflag, POSIX.1. FreeBSD. Linux. Mac OS X. Solaris) 在 已 设置 时 ， 忽 
略 输入 中 的 BREAK 条 件 。 关 于 BREAK 条 件 是 产生 SIGINT 信和 号 还 是 被 作为 
数据 读 取 ， 见 BRKINT。 

(c_iflag，POSIX.1、FreeBSD、Linux、Mac OS X, Solaris) HRB, WE 
接收 到 的 CR 字符 。 若 未 设置 此 标志 ， 而 设置 了 ICRNL 标志 ， 则 有 可 能 将 接收 
到 的 CR 字符 转换 成 NL 字符 。 

(c_iflag, POSIX.1, FreeBSD. Linux. Mac OS X. Solaris) 在 已 设置 时 ， 忽 
略 带 有 结构 出 错 (IE BREAK) 或 奇偶 出 错 的 输入 字 节 。 

(c_iflag, FreeBSD. Linux, Mac OS X, Solaris) 当 输 入 队列 满 时 响 铃 。 

(c iflag, POSIX.l. FreeBSD. Linux. Mac OS X. Solaris) ARH, WEE 
收 到 的 NL 字符 转换 成 CR 字符 。 
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INPCK 


ISIG 


ISTRIP 
688| IUCLC 
IUTF8 


IXANY 


IXOFF 


IXON 


MDMBUF 


NLDLY 
NOFLSH 


NOKERNINFO 


OCRNL 


(c_iflag, POSIX.l. FreeBSD. Linux. Mac OS X. Solaris) 在 已 设置 时 ， 使 
输入 奇偶 校 验 起 作用 。 若 未 设置 INPCK， 则 使 输入 奇偶 校 验 不 起 作用 。 

奇偶 “产生 和 检测 ”和 “输入 奇偶 校 验 ” 是 两 件 不 同 的 事 。 奇 偶 位 的 产生 和 检 
测 是 由 PARENB 标志 控制 的 。 设 置 该 标志 后 通常 会 使 串 行 接口 的 设备 驱动 程序 
对 输出 字符 产生 奇偶 位 ， 对 输入 字符 则 验证 其 奇偶 性 。PRARODD 标志 决定 该 奇 
偶 性 应 当 是 奇 还 是 偶 。 如 果 一 个 其 奇偶 性 错误 的 输入 字符 到 来 ， 则 检查 INPCK 
标志 的 状态 。 若 已 设置 此 标志 ， 则 检查 IGNPAR 标志 《以 决定 是 否 应 忽略 带 奇 
偶 出 错 的 输入 字 节 ); 若 不 应 忽略 此 输入 字 节 ， 则 检查 PARMRK 标志 以 决定 应 该 
向 读 进 程 传送 哪些 字符 。 

(c_lflag, POSIX.1. FreeBSD. Linux. Mac OS X. Solaris) 若 设置 ， 则 判别 
输入 字符 是 否 是 要 产生 终端 信号 的 特殊 字符 (INTR、QUIT、SUSP 和 DSUSP); 

车 是 ， 则 产生 相应 信和 号。 

(c_iflag, POSIX.1、FreeBSD、Linux、Mac OS X. Solaris) 在 已 设置 此 标志 
时 ， 有 效 输入 字 节 被 剥离 为 7 位 。 在 未 设置 时 ， 则 处 理 全 部 8 位。 

(c iflag, Linux. Solaris) 将 输入 的 大 写字 符 转 换 成 小 写字 符 。 

(c_iflag, Linux. MacOSX) 允许 使 用 UTF-8 多 字 节 字符 进行 字符 擦 除 处 理 。 
(c_iflag, XSI. FreeBSD. Linux. Mac OS X. Solaris) 使 任何 字符 都 能 重新 
启动 输出 。 

(c iflag, POSIX.1、FreeBSD、Linux、Mac OS X. Solaris) 若 设置 ， 则 使 启 
动 -停止 输入 控制 起 作用 。 当 终端 驱动 程序 发 现 输入 队列 将 要 填 满 时 ， 输 出 一 个 
STOP 字符 。 此 字符 应 当 由 发 送 数据 的 设备 识别 ， 并 使 该 设备 停止 。 此 后 ， 当 把 
输入 队列 中 的 字符 处 理 完毕 之 后 ， 终 端 驱动 程序 将 输出 一 个 START 字符 ,使 该 
设备 恢复 发 送 数据 。 

(c_iflag，POSIX.1、FreeBSD、Linux、Mac OS X. Solaris) 若 设置 ， 则 使 启 
动 -停止 输出 控制 起 作用 。 当 终端 驱动 程序 接收 到 一 个 STOP 字符 时 ， 输 出 停止。 

在 输出 停止 时 ， 下 一 个 START 字符 恢复 输出 。 者 未 设置 此 标志 ， 则 START 和 
STOP 字符 由 进程 作为 一 般 字符 读 取 。 

(c cflag, FreeBSD. Mac OS XO 按照 调制 解 调 器 的 载波 标志 进行 输出 流 控制 。 
这 是 CCAR OFLOW 标志 的 曾 用 名 。 

(c_oflag, XSI. Linux. Solaris) 换行 延迟 屏蔽 字 。 此 屏蔽 字 的 值 是 NLO 或 NL1。 
(c_lflag, POSIX.1, FreeBSD. Linux. Mac OS X. Solaris) 按 系 统 默认 ， 当 
终端 驱动 程序 产生 SIGINT 和 SIGQUIT 信和 号 时 ， 输 入 和 输出 队列 都 被 冲洗 。 

另外 ， 当 它 产 生 SIGSUSP 信号 时 ， 输 入 队列 被 冲洗 。 若 已 设置 NOFLSH 标志 ， 

则 在 这 些 信 号 产生 时 ， 不 对 输入 、 输 出 队列 进行 常规 冲洗 。 

(c lflag, FreeBSD. Mac OS X) 在 已 设置 时 ， 此 标志 阻止 STATUS 字符 打印 
前 台 进 程 组 的 信息 。 但 是 无 论 是 否 设置 此 标志 ，STATUS 字符 都 会 使 SIGINFO 
信号 被 发 送 至 前 台 进 程 组 。 

(c_oflag，XSI、FreeBSD、Linux、Solaris〉 若 设置 ， 则 将 输出 的 CR 字符 转 
换 成 NL 字符 。 


OFDEL 


OFILL 


OLCUC 


NLCR 


ONLRET 


ONOCR 
ONOEOT 


OPOST 


OXTABS 


PARENB 


PAREXT 


PARMRK 


PARODD 


PENDIN 


TABDLY 
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(c oflag, XSI、Linux、Solaris〉 若 设置 ， 则 输出 填充 字符 是 ASCH DEL: F 
则 是 ASCII NUL. Jl OFILL 标志 。 

(c oflag, XSI, Linux. Solaris) 车 设置 ， 则 传递 填充 字符 (ASCI DEL 或 
ASCIINUL, J OFDEL 标志 ) 以 实现 延迟 ， 而 不 使 用 时 间 延 迟 。 见 6 个 延迟 屏 
Rha: BSDLY. CRDLY. FFDLY. NLDLY. TABDLY 和 VTDLY。 

(c oflag, Linux, Solaris) 车 设置 ， 则 将 小 写字 符 转 换 成 大 写字 符 。 
(c_oflag, XSI, FreeBSD. Linux. Mac OS X. Solaris) 车 设置 ， 将 输出 的 
NL 字符 转换 成 CR-NL 字符 。 

(c_oflag, XSI、FreeBSD、Linux、Solaris〉 若 设置 ， 则 假定 输出 的 NL 字符 
执行 问 车 功能 。 

(c_oflag，XSI、FreeBSD、Linux、Solaris》 若 设置 ， 则 在 0 列 不 输出 CR 字符 。 
(c oflag, FreeBSD. Mac OS XO 若 设 置 ， 则 在 输出 中 丢弃 EOT OD) 字符 。 
在 某 些 将 Ctrl+D 解释 为 挂 浙 的 终端 上 ， 设 置 此 标志 可 能 是 必需 的 。 

(c oflag, POSIX.1、FreeBSD、Linux、Mac OS X. Solaris) 车 设置 ， 则 进行 
实现 定义 的 输出 处 理 。 关 于 c oflag 字段 的 各 种 实现 定义 标志 ， 见 图 18-6. 
(c oflag. FreeBSD. Mac OS XO 者 设置 ， 则 制 表 符 在 输出 中 被 扩展 为 空格 。 
这 与 将 水 平 制 表 符 延迟 (TABDLY ) 设置 为 XTABS 或 TAB3 所 产生 的 效果 相同 。 
(c, cflag. POSIX.1, FreeBSD. Linux. Mac OS X. Solaris) 若 设置 ， 则 对 输出 
字符 产生 奇偶 位 ， 对 输入 字符 执行 奇偶 校 验 。 若 已 设置 PARODD， 则 奇偶 校 验 是 
ARK: 否则 是 偶 校 验 。 另 见 对 INPCK、IGNPAR 和 PARMRK 标志 的 讨论 。 

(c cflag, Solaris) 选择 标记 或 空 奇偶 性 。 者 PARODD 设置 ， 则 奇偶 位 总 是 1 
《标记 奇偶 性 )， 耕 则 ， 奇 偶 位 总 是 0〈 空 奇偶 性 )。 

(c iflag, POSIX.1、FreeBSD、Linux、Mac OS X. Solaris) 在 已 设置 时 ， 
ERRE IGNPAR， 则 带 有 结构 出 错 〈 非 BREAK) 的 字 节 或 带 有 奇偶 出 错 的 
字 节 将 被 进程 读 作 一 个 3 字符 序列 \377、\0 HX, 其 中 天 是 接收 到 的 出 错字 
节 。 若 未 设置 ISTRIP， 则 一 个 有 效 的 \377 被 传送 给 进程 时 为 \377，\377。 
车 未 设置 IGNPAR 和 PARMRK, 则 带 有 结构 出 错误 或 奇偶 出 错 的 字 节 都 被 读 作 
一 个 字符 \0。 

(c_cflag，POSIX.1、FreeBSD、Linux、Mac OS X、Solaris〉 若 设置 ， 则 输出 
和 输入 字符 的 奇偶 性 都 是 奇 ， 否 则 为 偶 。 注 意 ，PRARENB 标志 控制 奇偶 性 的 产 
生 和 检测 。 

在 已 设置 CMSPAR 或 PAREXT 标志 时 ，PARODD 标志 也 控制 是 否 使 用 标记 或 空 
奇偶 性 。 

(c_lflag, FreeBSD. Linux, Mac OS X, Solaris) 若 设置 ， 则 在 下 一 个 字符 
输入 时 ， 尚 未 读 的 任何 输入 都 由 系统 重新 打印 。 这 一 动作 与 键入 REPRINT 字符 
时 的 作用 相 类 似 。 

(c oflag,. XSI, Linux. Mac OS X, Solaris) 水 平 制 表 符 延迟 屏蔽 字 。 此 屏蔽 
字 的 值 是 TAB0、TAB1、TAB2 或 TAB3. 

XTABS 的 值 等 于 TAB3。 此 值 使 系统 将 制 表 符 扩展 成 空格 。 系 统 假定 制 表 符 的 
长 度 为 8 个 空格 ， 不 能 更 改 此 假定 。 
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TOSTOP 


VTDLY 


XCASE 


(c lflag, POSIX.l. FreeBSD, Linux. Mac OS X. Solaris) 若 设置 ， 并 且 该 
实现 支持 作业 控制 ， 则 将 信号 SIGTTOU 送 到 试图 写 控制 终端 的 一 个 后 台 进 程 的 
进程 组 。 按 默认 ， 此 信号 暂停 该 进程 组 中 所 有 进程 。 如 果 写 控制 终端 的 后 台 进 
程 忽 略 或 阻塞 此 信号 ， 则 终端 驱动 程序 不 产生 此 信号 。 

(c_oflag, XSI. Linux, Solaris) 垂直 制 表 延迟 屏蔽 字 。 此 屏 项 字 的 值 是 VTO 
和 VT1。 

(c lflag, Linux. Solaris) 若 设置 ， 并 且 也 设置 TCANON， 则 终端 被 假定 为 只 
支持 大 写字 符 ， 全 部 输入 转换 为 小 写字 符 。 要 想 输入 一 个 大 写字 符 ， 要 在 其 前 
面 加 一 个 反 斜 枉 。 与 之 类 似 ， 系 统 和 输出 大 写字 符 时 ， 也 要 在 其 前 面 加 一 个 到 斜 
杠 。( 如 今 这 个 选项 标志 已 弃 用 ， 因 为 只 支持 大 写字 符 的 终端 即使 不 是 全 部 ， 也 
是 绝 大 部 分 都 已 经 不 存在 了 。) 


18.6 stty 命令 


上 节 说 明 的 所 有 选项 都 可 以 被 检查 和 更 改 : 在 程序 中 用 tcgetattr 和 tcsetattr 函数 
( 见 18.4 节 ) 进行 检查 和 更 改 ， 在 命令 行 (或 shell MA) 中 用 stty(1) 命 令 进行 检查 和 更 改 。 简 
单 地 说 ，stty(1) 命 令 就 是 图 18-7 中 所 列 的 前 6 个 函数 的 接口 。 如 果 以 -a 选项 执行 此 命令 ， 则 显 
示 终 端的 所 有 选项 : 


$ stty -a 
speed 9600 baud; 25 rows; 80 columns; 


lflags: 


iflags: 


oflags: 
cflags: 


cchars; 


icanon isig iexten echo echoe -echok echoke -echonl echoctl 
-echoprt -altwerase -noflsh -tostop -flusho pendin -nokerninfo 
-extproc 

-istrip icrnl -inlcr -igncr ixon -ixoff ixany imaxbel -ignbrk 
brkint -inpck -ignpar -parmrk 

opost onlcr -ocrnl -oxtabs -onocr -onlret 

cread cs8 -parenb -parodd hupcl -clocal -cstopb -crtscts 
-dsrflow -dtrflow -mdmbuf 

discard = ^O; dsusp = ^Y; eof = ^D; eol = <undef>; 

eol2 = <undef>; erase = ^H; erase2 = ^?; intr = ^C; kill = ^U; 
lnext = ^V; min = 1; quit = ^; reprint = ^R; start = ^Q; 
Status = ^T; stop = ^S; susp = ^Z; time = 0; werase = ^W; 


若 在 选项 名 前 有 一 个 连 字 符 ， 表 示 该 选项 禁用 。 最 后 4 行 显示 各 终端 特殊 字符 《〈 见 18.3 5) 


的 当前 设置 。 


第 1 行 显示 当前 终端 窗口 的 行 数 和 列 数 ，18.12 节 将 对 终端 窗口 大 小 进行 讨论 。 
stty 命令 使 用 它 的 标准 输入 获得 和 设置 终端 的 选项 标志 。 虽然 , 某 些 较 时 的 实现 使 用 标准 输 


”出 ,但 POSIX.1 要 求 使 用 标准 输入 。 本 书 讨论 的 4 种 实现 提供 了 在 标准 输入 上 操作 的 stty MA, 
”这 意味 着 如 果 希 望 了 解 名 为 ttyla 的 终端 的 设置 ， 那 么 可 以 键入 


stty -a </dev/ttyla 


18.7 ” 波 特 率 函数 


术语 波 特 率 (baud rate) 是 一 个 历史 沿用 的 术语 ， 现 在 它 指 的 是 “位 / 秒 ”(bit per second)。 虽 然 大 
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多 数 终端 设备 对 输入 和 输出 使 用 同一 波 特 率 ， 但 是 只 要 硬件 许可 ， 可 以 将 它们 设置 为 两 个 不 同 值 。 
#include <termios.h> 
speed t cfgetispeed(const struct termios *termptr); 


speed t cfgetospeed(const struct termios *fermptr): 


两 个 函数 的 返回 值 ， 波 特 率 值 


int cfsetispeed(struct termios *lermptr, speed t speed); 
int cfsetospeed(struct termios *fermptr, speed t speed); 
PAT RRS: 若 成 功 ， 返 回 0， 出 错 ， 返 回 -1 
两 个 cfget 函数 的 返回 值 ， 以 及 两 个 cfset 函数 的 speed 参数 都 是 下 列 常 量 之 一 : B50、 
B75. B110. B134. B150. B200. B300. B600. B1200. B1800. B2400. B4800, B9600, 
B19200 或 B38400。 常 量 BO 表示 “ 挂 断 ” 在 调用 tcsetattr 时 ， 如 若 将 输出 波 特 率 指定 为 
B0， 则 调制 解 调 器 的 控制 线 就 不 再 起 作用 。 


大 多 数 系统 定 义 了 另外 的 波 特 率 值 ， 如 B57600 以 及 B115250。 


使 用 这 些 函 数 时 ， 必 须 认 识 到 输入 、 输 出 波 特 率 是 存储 在 设备 的 termios 结构 中 的 ， 如 图 18-8 
所 示 。 在 调用 两 个 cfget 函数 中 的 任意 一 个 之 前 ， 要 先 用 tcgetattr 获得 设备 的 termios # 
构 。 与 此 类 似 ， 在 调用 两 个 cfset 函数 中 的 任意 一 个 之 后 ， 要 做 的 就 是 在 termios 结构 中 设置 
波 特 率 。 为 使 这 种 更 改 影响 到 设备 ， 应 当 调 用 tcsetattr 函数 。 即 使 所 设置 的 两 个 波 特 率 中 的 
任意 -一 个 出 错 ， 在 调用 tcsetattr 之 前 可 能 也 不 会 发 现 这 个 错误 。 
这 4 个 波 特 率 函数 的 存在 使 应 用 程序 不 必 考 虑 具体 实现 在 termios 结构 中 表示 波 特 率 的 不 同 
方法 。Linux 和 BSD 派生 的 平台 趋向 于 存储 波 特 率 的 数值 。( 即 9 600 波 特 率 存储 成 值 9600)， 然 
m, System V 派生 的 平台 (如 Solaris) 趋向 于 以 位 屏蔽 方式 编码 波 特 率 。 从 cfget 函数 得 到 的 速 
度 值 以 及 向 cfset 函数 传送 的 速度 值 都 未 转换 ， 与 它们 存储 在 termios 结构 中 的 表示 形式 一 样 。 


18.8 “ 行 控制 函数 


下 列 4 个 函数 提供 了 终端 设备 的 行 控制 能 力 。4 个 函数 都 要 求 参数 应 引用 一 个 终端 设备 ， 否 
则 出 错 返回 -1，errno 设置 为 ENOTTY。 


#include <termios.h> 





int tcdrain(int fd); 
int tcflow(int fd, int action); 


int tcflush(int fd, int queue); 


int tcsendbreak(int fd, int duration); 





tcdrain 函数 等 待 所 有 输出 都 被 传递 。tcflow 函数 用 于 对 输入 和 输出 流 控制 进行 控制 。 
action 参数 必定 是 下 列 4 个 值 之 一 。 

TCOOFF 输出 被 挂 起 。 

TCOON 重新 启动 以 前 被 挂 起 的 输出 。 

TCIOFF 系统 发 送 一 个 STOP 字符 ， 这 将 使 终端 设备 停止 发 送 数据 。 
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TCION 系统 发 送 一 个 START 字符 ， 这 将 使 终端 设备 恢复 发 送 数据 。 

tcflush 函数 冲洗 (抛弃) 输入 缓冲 区 (其 中 的 数据 是 终端 驱动 程序 已 接收 到 ,但 用 户 程 序 
尚未 读 取 的 ) 或 输出 缓冲 区 (其 中 的 数据 是 用 户 程 序 已 经 写 入 ,但 尚未 被 传递 的 )。gweue 参数 必 
定 是 下 列 3 个 常量 之 一 。 

TCIFLUSH 冲洗 输入 队列 。 

TCOFLUSH 冲洗 输出 队列 。 

TCIOFLUSH 冲洗 输入 队列 和 输出 队列 。 

tcsendbreak 函数 在 一 个 指定 的 时 间 区 间 内 发 送 连续 的 0 值 位 流 。 若 duration 参数 为 0, 
则 此 种 传递 延续 0.25—0.5 秒 。POSIX.1 WHE duration 非 0， 则 传递 时 间 依 赖 于 实现 。 


18.9 ”终端 标识 


历史 上 ， 在 大 多 数 UNIX 系统 版 本 中 ， 控 制 终端 的 名 字 一 直 是 /dev/tty。POSIX.1 提供 了 
个 运行 时 函数 ， 可 用 来 确定 控制 终端 的 名 字 。 





如 果 ptr EF, 则 被 认为 是 一 个 指针 ， UK REA A L ctermid SPP. 进程 的 控 
制 终端 名 存储 在 该 数组 中 。 常 量 L_ctermid 被 定义 在 <stdio.h> 中 。 车 pir 是 一 个 空 指针 ， 则 
该 函数 为 数组 (通常 作为 静态 变量 ) 分 配 空间 。 同 样 ， 进 程 的 控制 终端 名 存储 在 该 数组 中 。 

在 这 两 种 情况 中 ， 该 数组 的 起 始 地 址 都 被 作为 函数 值 返 回 。 因 为 大 多 数 UNIX 系统 都 使 用 
/dev/tty 作为 控制 终端 名 ， 所 以 此 函数 的 主要 作用 是 改善 向 其 他 操作 系统 的 可 移植 性 。 


当 调 用 ctermid 函数 时 ， 本 书 说 明 的 所 有 4 种 平台 都 返回 字符 串 /daev/tty。 


“X: ctermid MŽ 
18-12 给 出 的 是 POSIX.1 ctermid 函数 的 一 个 实现 。 


#include <stdio.h> 
#include <string.h> 


static char ctermid_name[L_ctermid]; 


char * 
ctermid(char *str) 
{ 
if (str == NULL) 
str = ctermid_name; 
return(strcpy(str, "/dev/tty")); /* strcpy() returns str */ 


18-12 POSIX.1 ctermid 函数 的 实现 
注意 ， 因 为 我 们 无 法 确定 调用 者 的 缓冲 区 大 小 ， 所 以 也 就 不 能 防止 过 度 使 用 该 缓冲 区 。 » 
另外 还 有 两 个 UNIX 系统 比较 感 兴 趣 的 函数 :， isatty 和 ttyname。 如 果 文 件 描述 符 引 用 一 
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个 终端 设备 ， 则 isatty 返回 真 。ttyname 返回 的 是 在 该 文件 描述 符 上 打开 的 终端 设备 的 路 径 名 。 


include <unistd.h> 


int isatty(int fd); 


返回 值 ， 若 为 终端 设备 ， 返 回 CO; EM, Belo CB) 


char *ttyname(int fd); 





返回 值 ， 指 向 终端 路 径 名 的 指针 ; 若 出 错 ， 返 回 NULL 


如 图 18-13 所 示 ，isatty 函数 很 容易 实现 。 我 们 只 尝试 使 用 了 其 中 一 个 终端 专用 函数 (如 
果 成 功 执行 ， 它 不 改变 任何 东西 )， 并 查看 了 其 返回 值 。 


#include <termios.h> 


int 
isatty(int fd) 
{ 
struct termios ts; 


return(tcgetattr(fd, &ts) !- -1); /* true if no error (is a tty) */ 


18-13 POSIX.l isatty 函数 的 实现 
使 用 图 18-14 中 的 程序 测试 isatty AR. 


#include "apue.h" 


int 

main(void) 

( 
printf("fd 0: s\n", isatty(0) ? "tty" : "not a tty"); 
printf("fd 1: %s\n", isatty(1) ? "tty" : "not a tty"); 
printf("fd 2: ts\n", isatty(2) ? "tty" : "not a tty"); 
exit(0); 


18-14 测试 1satty 函数 
运行 图 18-14 中 的 程序 ， 得 到 如 下 输出 : 
/ 
0 


S .f/a.out 
fd 0: tty 
fd 1: tty 
fd 2: tty 


$ ./a.out «/atc/passwd 2»/dev/null 

fd 0: not a tty 

fd 1: tty d 
fd 2: not a tty a 


时 实例 : ttyname MŽ 
ttyname 函数 〈 见 图 18-150. 比较 长 ， 因 为 它 要 搜索 所 有 设备 表 项 ， 寻 找 匹配 项 。 
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#include <sys/stat.h> 
#include «dirent.h» 
#include <limits.h> 
#include <string.h> 
finclude «termios.h» 
#include <unistd.h> 
#include <stdlib.h> 


struct devdir { 


struct devdir *d next; 
char *d name; 
} 
static struct devdir *head; 
static struct devdir *tail; 
static char pathname[ POSIX PATH MAX + 1]; 


Static void 
add(char *dirname) 


{ 


struct devdir *ddp; 
int len; 


len = strlen(dirname); 


/* 

* Skip ., .., and /dev/fd. 

£y 

if ((dirname[len-1] == '.') && (dirname[len-2] == '/' || 

(dirname[len-2] == '.' && dirname{len-3] == '/'))) 

return; 

if (stremp(dirname, "/dev/fd") == 0) 
return; 

if ((ddp = malloc(sizeof(struct devdir))) == NULL) 
return; 


if ((ddp->d_name = strdup(dirname)) == NULL) { 
free (ddp); 
return; 


ddp->d_next = NULL; 
if (tail == NULL) { 


head = ddp; 
tail = ddp; 
} else { 
tail->d_next = ddp; 
tail = ddp; 


static void 
cleanup (void) 


{ 


struct devdir *ddp, *nddp; 


ddp - head; 

while (ddp != NULL) { 
nddp = ddp-»d next; 
free(ddp-»d name); 
free (ddp); 
ddp = nddp; 

] 

head = NULL; 

tail = NULL; 


static char * 
searchdir(char *dirname, struct stat *fdstatp) 


{ 


struct stat devstat; 
DIR *dp; 

int devlen; 
struct dirent *dirp; 


strcpy (pathname, dirname); 

if ((dp = opendir(dirname)) == NULL) 
return (NULL); 

strcat(pathname, "/"); 

devlen = strlen(pathname) ; 

while ({dirp = readdir(dp)) != NULL) { 
strncpy (pathname + devlen, dirp->d_name, 

POSIX PATH MAX - devlen); 


/* 
* Skip aliases. 
*/ 
if (strcmp (pathname, "/dev/stdin") == li 
strcmp (pathname, "/dev/stdout") == O || 
strcmp (pathname, "/dev/stderr") == 0) 
continue; 
if (stat (pathname, &devstat) < 0) 
continue; 
if (S ISDIR(devstat.st mode)) { 
add (pathname) ; 
continue; 


} 
if (devstat.st ino == fdstatp->st_ino && 


devstat.st dev == fdstatp->st_dev) |  /* found a match */ 


closedir (dp); 
return (pathname) ; 


closedir (dp); 
return (NULL); 


char * 
ttyname(int fd) 


{ 
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struct stat fdstat; 

struct devdir *ddp; 

char *rval; 

if (isatty(fd) == 0) 
return (NULL); 


if (fstat(fd, &fdstat) < 0) 
return (NULL) ; 

if (S ISCHR(fdstat.st mode) == 0) 
return (NULL); 


rval = searchdir("/dev", &fdstat); 
if (rval == NULL) { 
for (ddp = head; ddp != NULL; ddp = ddp-»d next) 
if ((rval = searchdir(ddp-»d name, &fdstat)) != NULL) 
break; 


) 


cleanup(); 
return(rval); 


图 18-15 POSIX.1 ttyname 函数 的 实现 


此 处 使 用 的 技术 是 读 /dev 目录 ， 寻 找 具有 相同 设备 号 和 i 节点 编号 的 表 项 。 回 忆 4.24 节 ， 
每 个 文件 系统 都 有 一 个 唯一 的 设备 号 (stat 结构 中 的 st dev 字段 ， 见 4.2 节 )， 文 件 系统 
中 的 每 个 目录 项 都 有 一 个 唯一 的 i 节点 编号 (stat 结构 中 的 st_ino 字段 )。 在 此 函数 中 ， 
假定 在 找到 一 个 匹配 的 设备 号 和 匹配 的 i 节点 号 时 , 就 能 找到 所 希望 的 目录 项 。 也 能 验证 这 两 
个 表 项 与 st_rdev 字段 (终端 设备 的 主 设备 号 和 次 设备 号 ) 相 匹 配 ， 还 能 验证 该 目录 项 是 一 
个 字符 特殊 文件 。 但 是 ， 因 为 已 经 验证 了 文件 描述 符 参数 既是 一 个 终端 设备 ， 又 是 一 个 字符 
特殊 文件 , 而 且 因 为 在 UNIX 系统 中 ， 匹 配 的 设备 号 和 i 节点 编号 是 唯一 的 ， 所 以 不 再 需要 进 
行 另外 的 比较 。 
终端 名 可 能 在 /dev WHR. FE, 需要 搜索 /dev 下 的 整个 文件 系统 树 。 我 们 跳 过 了 少 
数 几 个 可 能 会 产生 不 正确 结果 或 奇怪 结果 的 目录 : /dev/.、/dev/. .和 /dev/fd。 我 们 也 跳 过 
了 一 些 别 名 ; /dev/stdin. /dev/stdout 以 及 /dev/stderr， 因 为 它们 是 /dev/fd 目录 中 
文件 的 符号 链接 。 
使 用 图 18-16 中 的 程序 测试 这 一 实现 。 


#include "apue.h" 


int 
main (void) 
{ 
char *name; 
if (isatty(0)) { 
name = ttyname (0); 
if (name == NULL) 
name = "undefined"; 
} else { 
name = "not a tty"; 


} 
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printf("fd 0: s\n", name); 


if (isatty(1)) ( 
name = ttyname({1); 


if (name == NULL) 
name = "undefined"; 
} else { 
name = "not a tty"; 


} 
printf("fd 1: s\n", name); 


if (isatty(2)) { 

name = ttyname(2); 

if (name == NULL) 

name = "undefined"; 

} else { 

name = "not a tty"; 
} 
printf ("fd 2: $sMn", name); 


exit (0); 


18-16 测试 ttyname 函数 

运行 图 18-16 中 的 程序 ， 得 到 ， 

$ ./a.out < /dev/console 2» /dev/null 

fd 0: /dev/console 

fd 1: /dev/ttys001 u 

fd 2: not a tty E 
18.10 规范 模式 

规范 模式 很 简单 : 发 一 个 读 请 求 ， 当 一 行 已 经 输入 后 ， 终 端 驱动 程序 即 返 回 。 以 下 几 个 条 件 
造成 读 返 回 。 


。 所 请 求 的 字 节 数 已 读 到 时 ， 读 返回 。 无 需 读 一 个 完整 的 行 。 如 果 读 了 部 分 行 ， 那 么 也 不 
会 丢失 任何 信息 ， 下 一 次 读 从 前 一 次 读 的 停止 处 开始 。 

e. 当 读 到 一 个 行 定 界 符 时 ， 读 返回 。 回 忆 18.3 节 ， 在 规范 模式 中 ， 下 列 字 符 被 解释 为 “ 行 
结束 ”: NL、EOL、EOL2 和 EOF。 另 外 ， 在 18.5 节 中 也 曾 说 明 ， 如 若 已 设置 ICRNL， 
但 未 设置 IGNCR， 则 CR 字符 的 作用 与 NL 字符 一 样 ， 也 终止 一 行 。 

在 这 5 个 行 界 定 符 中 ， 只 有 一 个 EOF 符 在 终端 驱动 程序 对 其 进行 处 理 后 即 被 丢弃 。 其 他 
4 个 字符 则 作为 其 所 处 行 的 最 后 一 个 字符 返回 给 调用 者 。 
e 如 果 捕 捉 到 信号 ， 并 且 该 函数 不 再 自动 重启 〈 见 10.5 节 )， 则 读 也 返回 。 


Wa XA: getpass ES 

下 面 说 明 getpass 函数 ， 它 读 入 用 户 在 终端 上 键入 的 口令 。 此 函数 由 Login(1) 和 crypt(1) 
程序 调用 。 为 了 读 取 口 令 ， 该 函数 必须 关闭 回 显 ， 但 仍 可 使 终端 以 规范 模式 进行 工作 ， 因 为 不 管 
键入 什么 作为 口令 都 能 构成 一 个 完整 行 。 图 18-17 显示 了 UNIX 系统 中 的 一 个 典型 实现 。 
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#include «signal.h» 

#include <stdio.h> 

#include <termios.h> 

#define MAX PASS LEN 8 /* max #chars for user to enter */ 
char * 


getpass(const char *prompt) 


( 


static char buf[MAX PASS LEN * 1]; /* null byte at end */ 
char *ptr; 

sigset_t sig, osig; 

struct termios ts, ots; 

FILE *fp; 

int CF 

if ((fp = fopen(ctermid(NULL), "r+")) == NULL) 


return (NULL) ; 
setbuf(fp, NULL); 


sigemptyset (&sig); 

sigaddset (&sig, SIGINT); /* block SIGINT */ 
sigaddset(&sig, SIGTSTP); /* block SIGTSTP */ 
sigprocmask(SIG BLOCK, &sig, &osig); /* and save mask */ 


tcgetattr(fileno(fp), &ts): /* save tty state */ 
ots = ts; /* structure copy */ 
ts.c lflag &= -(ECHO | ECHOE | ECHOK | ECHONL); 
tcsetattr(fileno(fp), TCSAFLUSH, &ts); 

fputs(prompt, fp); 


ptr = buf; 
while ((c = getc(fp)) != EOF && c != 'Mn!) 
if (ptr < &buf[MAX PASS, LEN]) 
*ptr++ = c; 
*ptr = 0; /* null terminate */ 
putc('\n', fp); /* we echo a newline */ 


tcsetattr(fileno(fp), TCSAFLUSH, &ots); /* restore TTY state */ 
sigprocmask(SIG SETMASK, &osig, NULL); /* restore mask */ 
fclose (fp); /* done with /dev/tty */ 

return (buf); 


18-17 getpass 函数 的 实现 

在 此 例 中 ， 应 当 考 虑 以 下 几 个 方面 。 

。 调用 ctermid 函数 打开 控制 终端 ， 而 不 是 直接 将 /dev/tty 写 在 程序 中 。 

。 只 是 读 、 写 控制 终端 ， 如 果 不 能 以 读 、 写 模式 打开 此 设备 则 出 错 返 回 。 还 有 一 些 其 他 的 
使 用 约定 。 在 GNU C 函数 库 版 本 中 ， 如 果 不 能 以 读 、 写 模式 打开 控制 终端 ， 则 getpass 
读 取 标 准 输入 ， 写 到 标准 错误 。 在 Solaris 版 本 中 ， 如 果 不 能 打开 控制 终端 ， 则 getpass 
失败 。 

。 阻塞 两 个 信号 SIGINT 和 SIGTSTP。 如 果 不 这 样 做 ， 在 输入 INTR 字符 时 就 会 使 程序 异 
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常 中止 ， 并 使 终端 仍 处 于 禁止 回 显 状态 。 与 此 相 类 似 ， 输 入 SUSP 字符 时 将 使 程序 停止， 
并 且 在 禁止 回 显 状 态 下 返回 到 sheil。 在 禁止 回 显 时 ， 我 们 选择 了 阻塞 这 两 个 信号。 如 果 
这 两 个 信号 是 在 读 取 口 令 期 间 产 生 的 ， 则 它们 会 一 直 被 保持 ， 直 到 getpass 返回 ,阻塞 mo 
才 会 解除 。 也 有 其 他 方法 来 处 理 这 些 信 和 号。 有 些 getpass 版 本 忽略 SIGINT (REL | 2 
前 的 动作 )， 在 返回 前 将 其 动作 恢复 为 以 前 的 值 。 这 就 意味 着 ， 在 该 信号 被 忽略 期 间 所 发 中 
生 的 这 种 信号 都 会 丢失 。 其 他 版 本 捕捉 SIGINT 《保存 它 以 前 的 动作 )， 如 果 捕 圳 到 此 信 
号 ， 则 在 恢复 终端 状态 和 信和 号 动作 后 ， 用 kill 函数 发 送 此 信和 号。 没有 一 个 getpass 版 
本 捕捉 、 忽 略 或 阻塞 STGQUIT， 所 以 输入 QUIT 字符 就 会 使 程序 异常 中 止 ， 并 且 很 可 能 
使 终端 保持 在 禁止 回 显 状态 。 
。 请 注意 ， 某 些 shell， 尤 其 是 Korn shell, 在 以 交互 方式 读 输 入 时 都 使 终端 处 于 回 显 状态 。 
这 些 shell 是 提供 命令 行 编辑 的 shell, 因此 在 每 次 输入 一 条 交互 命令 时 都 处 理 终端 状态 。 
所 以 如 果 在 这 种 shell 下 调用 此 程序 ， 并 且 用 QUIT 字符 使 其 异常 中 止 ， 则 这 种 shell 可 
能 会 恢复 回 显 状态 。 其 他 不 提供 命令 行 编辑 的 shell (如 Bourne shell) 将 使 程序 异常 中 
止 ， 并 使 终端 保持 在 不 回 显 状 态 。 如 果 对 终端 做 了 这 种 操作 ， 则 stty 命令 能 使 终端 恢 
复 到 回 显 状 态 。 
。 使 用 标准 IO 读 、 写 控制 终端 。 我 们 特地 将 流 设置 为 不 带 缓冲 的 ， 否 则 在 流 的 读 、 写 之 间 
可 能 会 有 某 些 交叉 《这 样 就 需要 多 次 调用 fflush)。 也 可 使 用 不 带 缓冲 的 VO 〈 见 第 3 
章 )， 但 是 在 这 种 情况 下 就 只 能 用 read 来 模仿 gete MA. 
© 最 多 只 存储 8 个 字符 作为 口令 。 输 入 的 其 他 多 余 字 符 则 全 部 被 忽略 。 
18-18 中 的 程序 调用 getpass 并 且 打 印 我 们 输入 的 内 容 。 这 是 为 了 验证 ERASE 和 KILL 
字符 能 备 正 常 工作 〈 如 同 它们 在 规范 模式 下 应 该 表现 的 那样 )。 
#include "apue.n" 
char *getpass (const char *); 
int 
main(void) 
{ 
char *ptr; 
if ((ptr = getpass("Enter password:")) -- NULL) 
err sys("getpass error"); 
printf("password: %s\n", ptr); 


/* now use password (probably encrypt it) ... */ 


while (*ptr !- 0) 


*ptr++ = 0; /* zero it out when we're done with it */ 
exit (0); 
} 
18-18 ”调用 getpass 函数 


如 果 调 用 getpass 函数 的 程序 使 用 的 是 明文 口令 ， 那 么 为 了 安全 起 见 ， 在 程序 完成 后 应 在 
内 存 中 清除 它 。 如 果 该 程序 会 产生 其 他 用 户 可 能 读 取 的 core 文件 〈 回 忆 10.2 $, core 的 系统 
默认 许可 权 使 每 个 用 户 都 能 读 它 )， 或 者 如 果 某 个 其 他 进程 能 够 设法 读 该 进程 的 存储 空间 ， 则 它 


570 第 18 章 终端 LO 


们 就 可 能 会 读 到 这 个 明文 口令 。(“ 明 文 ” 是 指 我 们 在 getpass 打印 的 提示 符 处 键入 的 口令 。 大 
多 数 UNIX 系统 程序 会 对 这 个 明文 口令 进行 修改 ， 将 它 转换 成 一 个 “可 密 ” 口 令 。 例 如 ， 口 令 文 
fF (9,62 节 ) 中 的 pw passwd 字段 包含 的 是 加 密 口 令 ， 而 不 是 明文 口令 。) "a 


18.11 IRER 


可 以 通过 关闭 termios 结构 中 c_lflag 字段 的 ICANON 标志 来 指定 非 规范 模式 。 在 非 规范 
模式 中 ， 输 入 数据 不 装配 成 行 ， 不 处 理 下 列 特 殊 字符 ( 见 18.3 节 ): ERASE. KILL. EOF. NL. 
EOL, EOL2. CR. REPRINT. STATUS 和 WERASE。 
如 前 所 述 ， 规 范 模式 很 容易 理解 ， 系统 每 次 至 多 返回 一 行 。 但 在 非 规范 模式 下 ， 系 统 如 何 
知道 在 什么 时 候 将 数据 返回 给 我 们 昵 ? 如 果 它 一 次 返回 一 个 字 节 ,那么 系统 开销 就 会 过 大 。( 回 
忆 图 3-6， 从 中 可 以 看 到 每 次 读 一 个 字 节 的 开销 有 多 大 。 如 果 每 次 返回 的 数据 加 倍 ， 那 么 系统 调 
用 的 开销 就 可 以 减 半 。) 在 启动 读数 据 之 前 ， 往 往 不 知道 要 读 多 少数 据 ， 所 以 系统 不 能 总 是 一 次 
返回 多 个 字 节 。 
解决 方法 是 ， 当 已 读 了 指定 量 的 数据 后 ， 或 者 已 经 超过 了 给 定量 的 时 间 后 ， 即 通知 系统 返回 。 
这 种 技术 使 用 了 termios 结构 中 c_cc 数组 的 两 个 变量 ， MIN 和 TIME. c cc 数组 中 的 这 两 个 
元 素 的 下 标 名 为 VMIN 和 VTIME。 
MIN 指定 一 个 read 返回 前 的 最 小 字 节 数 。TIME 指定 等 待 数据 到 达 的 分 秒 数 〈 分 秒 为 秘 的 
1/10). A FAI 4 种 情形 。 
情形 A: MIN>0，TIME>0 
TIME 指定 一 个 字 节 间 定 时 器 Cinterbyte timer)， 它 只 在 第 一 个 字 节 被 接收 时 启动 。 
在 该 定时 器 超时 之 前 ， 若 已 接 到 MIN 个 字 节 ， 则 read 返回 MIN 个 字 节 。 如 果 在 
接 到 MIN 个 字 节 之 前 ， 该 定时 器 已 超时 ， 则 read 返回 已 接收 到 的 字 节 。( 因 为 定 
时 器 是 在 第 一 个 字 节 被 接收 后 启动 的 ， 所 以 在 定时 器 超时 时 ，read 至 少 会 返回 一 
^u.) 在 这 种 情形 中 ， 第 一 个 字 节 被 接收 之 前 ， 调 用 者 会 一 直 阻 塞 。 如 果 在 调 
用 read 时 数据 已 经 可 用 ， 则 就 如 同 在 read 后 数据 被 立即 接收 了 一 样 。 

情形 B: MIN»0, TIME--0 
read 在 接收 到 MIN 个 字 节 之 前 不 返回 。 这 会 造成 read 无 限期 阻塞 。 

情形 C: MIN=0, TIME>0 
TIME 指定 一 个 调用 read 时 启动 的 读 定时 器 。 (与 情形 A 相 比 较 ， 两 者 是 不 同 的 。 
在 情形 A 中 ， 非 0 TIME 表示 字 节 间 定 时 器 ， 该 定时 器 要 等 到 第 一 个 字 节 被 接收 时 
FAZ.) 在 接 到 一 个 字 节 或 者 该 定时 器 超时 时 ，read 即 返回 。 如 果 是 定时 器 超时 ， 
Ji] read 返回 0. 

情形 D: MIN=0, TIME—0 
如 果 有 数据 可 用 ， 则 read 最 多 返回 所 要 求 的 字 节 数 。 如 果 无 数据 可 用 ， 则 read 
立即 返回 0. 

在 所 有 这 些 情形 中 ，MIN 只 是 最 小 值 。 如 果 程 序 要 求 的 数据 多 于 MIN 个 字 节 ， 那 么 它 或 许 
能 接收 到 所 要 求 的 字 节 数 。 这 也 适用 于 MIN 一 0 的 情形 C 和 情形 D. 

图 18-19 总 结 并 列 出 了 非 规范 模式 输入 的 4 种 不 同情 形 。 在 这 个 图 中 ，nbytes 是 read 的 第 
三 个 参数 (返回 的 最 大 字 节 数 )。 


MIN > 0 MIN 
A: 在 定时 器 超时 前 ， C: 在 定时 器 超时 前 ， 















read 返回 [MIN, nbytes}; read 返回 [1, nbytes): 
TIME » 0 如 果 定 时 器 超时 ， 如 果 定 时 器 超时 ， 
read 返回 [1, MIN]. read 返回 0。 
(TIME= 字 节 间 定时 器 。 《TIME=read 定时 器 。) 
调用 者 会 无 限期 阻塞 。) 
TIME 一 





图 18-19 ” 非 规范 输入 的 4 种 情形 


请 注意 ，POSIX.1 允许 下 标 VMIN 和 VTIME 的 值 分 别 与 VEOF 和 VEOL 的 相同 。 确 实 ，Solaris 就 


B: 当 有 可 用 数据 时 ， D: read 立即 返回 [0, nbytes}. 
read 返回 [MIN, nbytes]. 
《调用 者 可 无 限期 阻塞 , ) 
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是 这 样 做 的 ， 这 样 就 提供 了 与 System V 的 早期 版 本 的 兼容 性 。 但 是 ， 这 也 带 来 了 可 移植 性 问题 。 从 非 
规范 模式 转 挽 为 规范 模式 时 ， 必 须 恢复 VEOF 和 VEOL。 如 果 VMIN 等 于 VECF， 且 不 恢复 它们 的 值 ， 
那么 当 把 VMIN 的 典型 值 设置 为 1 时 ， 文 件 结束 符 就 变 成 了 CtrltA。 解 决 这 一 问题 最 简单 的 方法 是 : 
在 要 转 入 非 规范 模式 时 ， 将 整个 termios 结构 保存 起 来 ， 以 后 再 要 转 回 规范 模式 时 恢复 它 。 


5a 实例 


图 18-20 中 的 程序 定义 了 函数 tty_cbreak 和 tty_raw， 它 们 将 终端 分 别 设置 为 cbreak 模 


X, ( cbreak mode) 和 原始 模式 (raw mode)。( 术 语 cbreak 和 原始 来 自 于 V7 的 终端 驱动 程序 。) 


tty reset 函数 的 功能 是 将 终端 恢复 到 原始 的 工作 状态 (也 就 是 调用 tty_cbreak EX tty. raw 


之 前 的 工作 状态 )。 


如 果 已 调用 tty_cbreak， 那 么 在 调用 tty raw 之 前 需要 调用 tty_reset。 如 果 已 调用 
tty_raw， 然 后 又 要 调用 tty_cbreak， 那 么 在 此 之 前 同样 也 要 调用 tty_reset。 这 减少 了 出 


错时 终端 处 于 不 可 用 状态 的 机 会 


该 去 程序 还 提供 了 另外 两 个 函数 tty atexit 和 tty termios。 tty atexit H 可 被 登记 为 


退出 处 理 程序 ， 以 保证 exit 恢复 终端 工作 模式 。tty_termios 则 返回 一 个 指向 原来 规范 模式 


F termios 结构 的 指针 。 


#include "apue.h" 
#include <termios.h> 
#include <errno.h> 


static struct termios save_termios; 
static int ttysavefd = -1; 
static enum { RESET, RAW, CBREAK } ttystate = RESET; 


int 
tty_cbreak (int fd) /* put terminal into a cbreak mode */ 
{ 

int err; 

struct termios buf; 


if (ttystate != RESET) { 
errno = EINVAL; 
return(-1); 
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} 
if (tcgetattr(fd, &buf) < O0) 
return(-1); 
Save_termios = buf; /* structure copy */ 


/* 

* Echo off, canonical mode off. 
*/ 
buf.c lflag &= -(ECHO | ICANON); 


/* 
* Case B: 1 byte at a time, no timer. 
*/ 

buf.c cc[VMIN] » 1; 

buf.c cc[VTIME] = 0; 
if (tcsetattr(fd, TCSAFLUSH, &buf) < 0) 

returní(-1); 


/* 
* Verify that the changes stuck. tcsetattr can return 0 on 
* partial success. 
a7 
if (tcgetattr(fd, &buf) « 0) { 
err = errno; 
tcsetattr(fd, TCSAFLUSH, &save termios); 
errno - err; 
return(-l)}; 
} 
if ((buf.c_lflag & (ECHO | ICANON)) || buf.c_cc[VMIN] != 1 |I 
buf.c, cc(VTIME] != 0) ( 
/* 
* Only some of the changes were made. Restore the 
* original settings. 
*/ 
tcsetattr(fd, TCSAFLUSH, &save termios); 
errno = EINVAL; 
returní-1); 


ttystate - CBREAK; 
ttysavefd - fd; 
return (0); 


int 
tty raw(int fd) /* put terminal into a raw mode */ 
( 

int err; 

struct termios buf; 


if (ttystate !- RESET) ( 
errno = EINVAL; 
return (-1); 


} 
if (tcgetattr(fd, &buf) < 0) 


return(-1); 
save termios - buf; /* structure copy */ 
/* 
* Echo off, canonical mode off, extended input 
* processing off, signal chars off. 
*/ 
buf.c lflag &= ~ (ECHO | 


ICANON | IEXTEN | 


/* 


ISIG); 


* No SIGINT on BREAK, CR-to-NL off, input parity 


* check off, don't strip 8th bit on input, output 


* flow control off. 
*/ 
buf.c iflag &- -(BRKINT | ICRNL | 


/* 
* Clear size bits, parity checking off. 


&/ 


buf.c cflag &= -(CSIZE | PARENB); 
/* 

* Set 8 bits/char. 

*/ 
buf.c cflag |= CS8; 

/* 

* Output processing off. 

ay 


buf.c oflag &= -(OPOST); 


/* 

* Case B: 

my 

buf.c_cc(VMIN] = 1; 

buf.c cc[VTIME] = 0; 

if (tcsetattr(fd, TCSAFLUSH, 
return (-1); 


l byte at a time, no timer. 


&buf) < 0) 


/* 
* Verify that the changes stuck. 
* partial success. 


*/J 

if (tcgetattr(fd, &buf) < 0) { 
err = errno; 
tcsetattr(fd, TCSAFLUSH, &save termios); 
errno - err; 


return(-1); 


) 


if ((buf.c_lflag & (ECHO | ICANON | 


(buf.c cflag & (CSIZE | PARENB | CS8)) !- CSB 
(buf.c_oflag & OPOST) || buf.c cc(VMIN) 
buf.c cc[VTIME] != 0) { 

/* 


INPCK | ISTRIP | 


IEXTEN | ISIG)) 
(buf.c iflag & (BRKINT | ICRNL | INPCK | ISTRIP | 


!= 1 |l 


IXON); 


11 
IXON)) 


tcsetattr can return 0 on 
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} 


int 


) 


* Only some of the changes were made. Restore the 
* original settings. 

*7 

tcsetattr(fd, TCSAFLUSH, &save termios); 

errno - EINVAL; 

returní(-1): 


ttystate - RAW; 
ttysavefd = fd; 
return(0); 


tty reset(int fd) /* restore terminal's mode */ 


{ 


} 


void 


if (ttystate == RESET) 


return(0); 


if (tcsetattr(fd, TCSAFLUSH, &save termios) < 0) 


returní-1); 


ttystate - RESET; 
return(0); 


tty atexit (void) /* can be set up by atexit(tty atexit) */ 


{ 


) 


if (ttysavefd »- 0) 


tty reset(ttysavefd); 


struct termios * 
tty termios (void) /* let caller see original tty state */ 


i 


) 


return (&save_termios); 


18-20 ”将 终端 模式 设置 为 cbreak 模式 或 原始 模式 


cbreak 模式 的 定义 如 下 。 


非 规范 模式 。 如 本 节 开 始 处 所 述 ， 这 种 模式 关闭 了 对 某 些 输入 字符 的 处 理 。 这 种 模式 没 
有 关闭 对 信号 的 处 理 ， 所 以 用 户 始 终 可 以 键入 一 个 能 够 触发 终端 产生 信号 的 字符 。 请 注 
意 ， 调 用 者 应 当 捕 提 这 些 信 号 ， 否 则 这 种 信号 就 有 可 能 终止 程序 ， 并 且 使 终端 保持 在 
cbreak 模式 。 

作为 一 般 规 则 ， 在 编写 更 改 终端 模式 的 程序 时 ， 应 当 捕 提 大 多 数 信 号， 以 便 在 程序 终止 
前 恢复 终端 模式 。 

关闭 回 显 。 

每 次 输入 一 个 字 节 。 为 此 ,将 MN 设置 为 1， 将 TIME 设置 为 0。 这 是 图 18-19 中 的 情形 
B。 至 少 有 一 个 字 节 可 用 时 ，read 才 返 回 。 


对 原始 模式 的 定义 如 下 。 


非 规范 模式 。 也 关闭 了 对 信号 产生 字符 CSIC) 和 扩充 输入 字符 CIEXTEN) 的 处 理 。 
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另外 还 禁用 了 BRKINT 字符 ， 使 BREAK 字符 不 再 产生 信号 。 

。 关闭 回 显 。 

e 禁止 输入 中 的 CR 到 NL 映射 (ICRNIL)、 输 入 奇偶 检测 〈INPCK)、 和 剥离 输入 字 节 的 第 8 
AL CISTRIP) 以 及 输出 流 控制 CIXOND. 

e 8 位 字符 (cs8)， 且 禁用 奇偶 校 验 (PARENB)。 

© 禁止 所 有 输出 处 理 (OPOST )。 

。 每 次 输入 一 个 字 节 (MIN=1，TIME=0)。 

图 18-21 中 的 程序 测试 原始 模式 和 cbreak 模式 。 


#include "apue.h" 


static void 

sig _ catch (int signo) 

{ 
printf("signal caught\n") ; 
tty reset (STDIN FILENO); 
exit (0); 


int 
main (void) 


{ 


int i; 

char c; 

if (signal(SIGINT, sig catch) -- SIG ERR) /* catch signals */ 
err sys("signal(SIGINT) error"); 

if (signal(SIGQUIT, sig catch) -- SIG ERR) 
err sys("signal(SIGQUIT) error"); 

if (signal(SIGTERM, sig catch) -- SIG ERR) 


err sys("signal(SIGTERM) error"); 


if (tty raw(STDIN FILENO) < 0) 
err sys("tty raw error"); 
printf("Enter raw mode characters, terminate with DELETEMn"); 


while ((i = read(STDIN FILENO, &c, 1)) == 1) 1 
if ((c &9 255) == 0177) /* 0177 = ASCII DELETE */ 
break; 


printf ("%o\n", c); 
} 
if (tty reset(STDIN FILENO) < 0) 
err, Sys("tty reset error"); 
if (i <= 0) 
err sys("read error"); 
if (tty cbreak(STDIN FILENO) < 0) 
err sys("tty cbreak error"); 
printf("XnEnter cbreak mode characters, terminate with SIGINT\n"); 
while ((i = read(STDIN FILENO, &c, 1)) == 1) { 
C &- 255; 
printf("$oMn", c); 
) 
if (tty reset(STDIN FILENO) « 0) 
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err sys("tty reset error"); 
if (i <= 0) 
err Sys("read error"); 


exit (0); 
} 
18-21 测试 原始 终端 模式 和 cbreak 终端 模式 
运行 图 18-21 中 的 程序 ， 可 以 观察 这 两 种 终端 工作 模式 的 工作 情况 。 
$ ./a.out 


Enter raw mode characters, terminate with DELETE 
4 


33 
133 
61 
70 
176 

键入 Delete 
Enter cbreak mode characters, terminate with SIGINT 
1 键入 Ctri+A 
10 键入 退 格 
signal caught RA Pee 


在 原始 模式 中 ， 输 入 的 字符 是 CtrlI+HD (04) 和 特殊 功能 键 F7。 在 所 用 的 终端 上 ， 此 功能 键 产生 5 
个 字符 ，ESC (033). [ (0133). 1 (061)、8 (070) 和 ”~ (0176)。 注 意 ， 在 原始 模式 下 关闭 了 输 
出 处 理 〈(-OPOST)， 所 以 在 每 个 字符 后 没有 得 到 回 车 符 。 另 外 还 要 注意 的 是 ， 在 cbreak 模式 下 ， 
不 对 输入 特殊 字符 进行 处 理 〈 因 此 没 对 Ctl+D、 文 件 结束 符 和 退 格 进行 特殊 处 理 )， 但 是 仍 对 终 
端 产生 的 信号 进行 处 理 。 a" 


18.12 ”终端 窗口 大 小 


KER UNIX 系统 都 提供 了 一 种 跟踪 当前 终端 窗口 大 小 的 方法 ， 在 窗口 大 小 发 生变 化 时 ， 使 
内 核 通知 前 台 进程 组 。 内 核 为 每 个 终端 和 伪 终 端 都 维护 了 一 个 winsize 结构 ; 


struct winsize { 


unsigned short ws_row; /* rows, in characters */ 
unsigned short ws_col; /* columns, in characters */ 
unsigned short ws_xpixel; /* horizontal size, pixels (unused) */ 
unsigned short ws_ypixel; /* vertical size, pixels (unused) */ 
E 
此 结构 的 规则 如 下 。 


e 用 ioctl (93.15 节 ) 的 TIOCGWINS2 命令 可 以 取 此 结构 的 当前 值 。 
e 用 ioctl 的 TIOCSWINSZ 命令 可 以 将 此 结构 的 新 值 存储 到 内 核 中 。 如 果 此 新 值 与 存储 
在 内 核 中 的 当前 值 不 同 ， 则 前 台 进 程 组 会 收 到 SIGWINCH fa5. GEM, MA 10-1 中 可 
710 以 看 出 ， 此 信和 号 的 系统 默认 动作 是 被 忽略 。) 
e 除了 存储 此 结构 的 当前 值 以 及 在 此 值 改 变 时 产生 一 个 信号 以 外 ， 内 核对 该 结构 不 进行 任 
何其 他 操作 。 对 结构 中 的 值 进 行 解释 完全 是 应 用 程序 的 工作 。 
提供 这 种 功能 的 目的 是 ， 当 窗口 大 小 发 生变 化 时 应 用 程序 能 够 得 到 通知 (如 vi 编辑 器 )。 应 
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用 程序 接收 此 信号 后 ， 可 以 获取 窗口 大 小 的 新 值 ， 然 后 重 绘 屏幕 。 


sa 实例 


18-22 所 示 的 程序 打印 当前 窗口 大 小 ， 然 后 休眠 。 每 次 窗口 大 小 改变 时 ， 程 序 就 捕捉 到 
SIGWINCH 信号 ， 然 后 打印 新 的 窗口 大 小 。 我 们 必须 用 一 个 信号 终止 此 程序 。 


#include "apue.h" 
#include <termios.h> 
#ifndef TIOCGWINSZ 
#include <sys/ioctl.h> 
#endif 





static void 
pr winsize(int fd) 
{ 


struct winsize size; 


if (ioctl(fd, TIOCGWINSZ, (char *) &size) < 0) 
err sys ("TIOCGWINSZ error"); 
printf("&d rows, $d columns\n", size.ws row, size.ws col); 


) 


static void 

sig winch(int signo) 

{ 
printf("SIGWINCH received\n"); 
pr winsize(STDIN FILENO); 


int 
main (void) 
( 
if (isatty(STDIN FILENO) == 0) 
exit(1); 
if (signal(SIGWINCH, sig winch) == SIG ERR) 
err sys("signal error"); 


pr winsize(STDIN FILENO); /* print initial size */ 
for (: : ) /* and sleep forever */ 
pause (); 


18-22 打印 窗口 大 小 
在 一 个 带 窗口 终端 的 系统 上 运行 图 18-22 中 的 程序 得 到 : 


$ ./a.out 

35 rows, 80 columns 初始 大 小 

SIGWINCH received 更 改 窗口 大 小 : 捕 提 到 信和 号 
40 rows, 123 columns 

SIGWINCH received 再 一 次 


42 rows, 33 columns 


^C $ 键入 中 断 键 以 终止 
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18.13 termcap, terminfo 和 curses 


termcap 的 意思 是 终端 能 力 〈terminal capability)， 它 涉及 文本 文件 /etc/termcap 和 
一 套 读 此 文件 的 例 程 。termcap 这 种 技术 是 在 伯克利 开发 的 ， 注 意 是 为 了 支持 vi 编辑 器 。 
termcap 文件 包含 了 对 各 种 终端 的 说 明 : 终端 支持 哪些 功能 〈 如 行 数 、 列 数 、 终 端 是 否 支持 
退 格 )， 如 何 使 终端 执行 某 些 操作 〈 如 清 屏 、 将 光标 移动 到 给 定位 置 )。 把 这 些 信 息 从 编译 过 
的 程序 中 取出 来 并 把 它们 放 在 易于 编辑 的 文本 文件 中 , 这 样 就 使 得 vi 编辑 器 能 在 很 多 不 同 的 
终端 上 运行 。 

最 后 ， 将 支持 termcap 文件 的 例 程 从 vi 编辑 器 中 抽取 出 来 ， 放 在 一 个 单独 的 curses 库 
中 。 为 使 这 套 库 可 供 要 进行 屏幕 处 理 的 任何 程序 使 用 ， 还 增加 了 很 多 功能 。 

termcap 这 种 技术 并 不 是 很 完善 。 当 越 来 越 多 的 终端 被 加 到 数据 文件 中 时 ,为 找到 一 个 特定 
的 终端 ， 需 要 花费 更 长 的 时 间 扫 描 此 数据 文件 。 这 个 数据 文件 还 用 两 个 字符 的 名 字 来 标识 不 同 的 
终端 属性 。 这 些 缺 陷 迫 使 开发 人 员 开 发 出 了 terminfo 以 及 与 其 相关 的 curses 库 。 在 terminfo 
中 ， 终 端 说 明基 本 上 都 是 文本 说 明 的 编译 版 本 ， 在 运行 时 易于 被 快速 定位 。terminfo 最 初 由 
SVR2 开始 使 用 ， 此 后 所 有 System V 的 版 本 都 使 用 它 。 


历史 上 , 基于 System V 的 系统 使 用 terminfo, BSD 派生 的 系统 使 用 termcap, 但 是 现在 ， 
| 系统 通常 两 者 都 提供 。 然 而 Mac OS X 12 X K terminfo。 


Goodheart[1991] 对 terminfo Ñ curses 库 进 行 了 详细 说 明 , 但 此 书 已 不 再 增 印 ,Strang[1986] 
说 明了 curses 函数 库 的 伯克利 版 本 。 Strang. Mui 和 O’Reilly[1988] 则 对 termcap 和 terminfo 
进行 了 说 明 。 

可 在 nttp://invisible-island.net/ncurses/ncurses.html 或 http://www.gnu. 
org/software/ncurses 上 找到 与 SVR4 curses 接口 兼容 的 开放 版 ncurses AAE, 


不 论 是 termcap 还 是 terminfo， 它 们 本 身 都 不 处 理 本 章 所 述 及 的 问题 : 更改 终 端的 模 

式 、 更 改 终端 特殊 字符 、 处 理 窗 口 大 小 等 。 它 们 亡 提供 的 是 在 各 种 终端 上 执行 典型 操作 【〈 清 屏 、 

移动 光标 ) 的 方法 。 另 一 方面 ， 在 本 章 所 述 问 题 方 面 ，curses 能 提供 某 种 具体 细节 方面 的 帮 

Hj. curses 提供 了 很 多 函数 ， 用 来 设置 原始 模式 、 设 置 cbreak 模式 、 打 开 和 关闭 回 显 等 。 注 

意 ，curses 库 是 为 基于 字符 的 哑 终 端 设 计 的 ， 而 如 今 ， 它 们 大 部 分 已 被 以 基于 像素 的 图 形 终 
端 所 代替 。 


18.14 小 结 


终端 有 很 多 特征 和 选项 ， 其 中 大 多 数 都 可 按 需 进行 更 改 。 本 章 描述 了 很 多 更 改 终端 操作 《〈 即 
更 改 特殊 输入 字符 和 可 选择 标志 ) 的 函数 ， 还 介绍 了 可 对 终端 设备 进行 设置 或 恢复 的 各 个 终端 特 
殊 字 符 以 及 众多 选项 。 

终端 的 输入 模式 有 两 种 一 一 规范 的 《每 次 一 行 》 和 非 规 范 的 。 本 章 中 包含 了 若干 这 两 种 工作 
模式 的 实例 ， 也 提供 了 一 些 函数 ， 它 们 在 POSIX.1 终端 选项 和 较 早 的 BSD cbreak 模式 及 原始 模 
式 之 间 进 行 映 射 。 本 章 还 说 明了 如 何 获取 和 改变 终端 窗口 大 小 。 





习题 579 


习题 


18.1 编写 一 个 调用 tty raw 并 且 不 恢复 终端 模式 就 终止 的 程序 。 如 果 系 统 提供 reset(1) 命 令 
《本 书 说 明 的 4 种 平台 全 都 提供 )， 使 用 该 命令 恢复 终端 模式 。 
182 c cflag 字段 的 PARODD 标志 允许 我 们 设置 奇 检验 或 偶 校 验 ， 而 BSD PH tip RFE f 
许 奇 侦 校 验 位 为 0 或 1。 它 是 如 何 实现 的 ? 
18.3 如 果 你 系统 中 的 stty(]) 命 令 输 出 MIN 和 TIME 值 ， 做 下 面 的 练习 。 登 录 系 统 两 次 ， 其 中 
一 次 登录 时 打开 vi 编辑 器 ， 在 另外 一 次 登录 中 用 stty 命令 确定 vi 设置 的 MIN 和 TIME 
É (因为 vi 将 终端 设置 为 非 规范 模式 )。( 如 果 你 的 终端 上 有 窗口 系统 正在 运行 ， 那 么 你 也 
可 以 进行 同样 的 测试 ， 方 法 是 :; 登录 一 次 ， 然 后 用 两 个 分 开 的 窗口 。) 713 
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19.1 引言 


在 第 9 章 中 ， 我 们 了 解 到 ， 终 端 登录 是 经 由 自动 提供 终端 语义 的 终端 设备 进行 的 。 在 终端 和 运行 
程序 之 间 有 一 个 终端 行规 程 ( 见 图 18-2)， 通 过 该 规程 我 们 能 够 设置 终端 的 特殊 字符 (如 退 格 、 行 删 
除 、 中 断 等 )。 但 是 ， 当 一 个 登录 请 求 到 达 网 络 连接 时 ， 终 端 行规 程 并 不 是 自动 被 加 载 到 网 络 连接 和 
登录 shell 之 间 的 。 图 9-5 显示 了 一 个 伪 终 端 (pseudo terminal) 设备 驱动 程序 ， 用 于 提供 终端 语义 。 

伪 终 端 除 了 用 于 网 络 登录 ， 还 有 其 他 用 途 ， 本 章 将 对 此 进行 介绍 。 首 先 概要 叙述 如 何 使 用 伪 
终端 ， 接 着 讨论 某 些 特殊 使 用 情况 。 然 后 ， 提 供 在 多 种 平台 下 用 于 创建 伪 终 端的 函数 ， 并 使 用 这 
些 函 数 编写 一 个 程序 ， 我 们 将 该 程序 称 为 pty。 将 看 到 pty 程序 的 各 种 用 途 : 抄录 在 终端 上 输入 
和 输出 的 所 有 字符 (script(1) 程 序 ); 运行 协同 进程 来 避免 图 15-19 中 的 程序 遇 到 的 缓冲 区 问题 。 


19.2 概述 


伪 终端 这 个 术语 是 指 ， 对 于 一 个 应 用 程序 而 言 ， 它 看 上 去 像 一 个 终端 ， 但 事实 上 它 并 不 是 一 
个 真正 的 终端 。 图 19-1 显示 了 使 用 伪 终 端 时 ， 
相关 进程 的 典型 安排 。 图 中 的 关键 点 如 下 。 
。 通常 ， 一 个 进程 打开 伪 终 端 主 设备 ， 然 
后 调用 fork。 子 进程 建立 一 个 新 的 会 
话 ， 打 开 一 个 相应 的 伪 终 端 从 设备 ， 将 『 
其 文件 描述 符 复制 到 标准 输入 、 标 准 输 | 
出 和 标准 错误 , 然后 调用 exec. 伪 终 端 | 
从 设备 成 为 子 进程 的 控制 终端 。 | 
e 对 于 伪 终 端 从 设备 上 的 用 户 进程 来 说 ， 
其 标准 输入 、 标 准 输出 和 标准 错误 都 是 C 
终端 设备 。 通 过 这 些 描述 符 ， 用 户 进程 ， 
能 够 处 理 第 18 章 中 的 所 有 终端 UO R | 
数 。 但 是 因为 伪 终 端 从 设备 不 是 真正 的 | 
终端 设备 ， 所 以 无 意义 的 函数 调用 〈 例 | 
如 ， 改 变 波 特 率 、 发 送 中 断 符 、 设 置 奇 | 
偶 校 验 ) 将 被 忽略 。 19-1 使 用 伪 终 端的 相关 进程 的 典型 结构 
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。 任何 写 到 伪 终 端 主 设备 的 都 会 作为 从 设备 的 输入 ， 反 之 亦 然 。 事 实 上 ， 所 有 从 设备 端的 


输入 都 来 自 于 伪 终 端 主 设备 上 的 用 户 
进程 。 这 看 起 来 就 像 一 个 双向 管道 , 但 
从 设备 上 的 终端 行规 程 使 我 们 拥有 普 
通 管道 没有 的 其 他 处 理 能 力 。 

图 19-1 显示 了 FreeBSD. Mac OSX 或 Linux 
系统 中 的 伪 终 端 结构 。19.3 节 将 介绍 如 何 打开 
这 些 设备 。 

在 Solaris 中 , 伪 终 端 是 使 用 STREAMS T 
系统 构建 的 ( 见 14.4 节 )。 图 19-2 详细 描述 了 
Solaris 中 各 个 伪 终 端 STREAMS 模块 的 安排 。 
虚线 框 中 的 两 个 STREAMS 模块 是 可 选 的 。 
pekt 和 ptem 模块 帮助 提供 伪 终 端 特有 的 语 
义 。 另 外 两 个 模块 (laterm 和 ttcompat) 
提供 行规 程 处 理 。19.3 节 将 展示 如 何 建立 这 些 
STREAMS 模块 的 安排 。 

现在 简化 以 上 图 示 ， 不 再 画 出 图 19-1 中 的 
“FAAS PAR” RE 19-2 中 的 “ 流 首 ”。 同 
时 使 用 缩写 “PTY” 表 示 伪 终端 ， 并 将 图 19-2 
中 所 有 伪 终 端 从 设备 之 上 的 STREAMS 模块 
合并 在 一 起 表示 为 “终端 行规 程 ”模块 ， 像 
图 19-1 中 的 那样 。 

现在 , 我 们 来 考察 伪 终 端的 某 些 典 型 用 途 。 

1， 网 络 登 录 服 务 器 
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19-2. Solaris 中 的 伪 终 端 安排 


stdin, stdout, stderr 


内 核 


伪 终 端 可 用 于 构造 提供 网 络 登录 的 服务 器 。 典 型 的 例子 是 telneta 和 rlogind 服务 器 。 


Stevens[1990] 中 的 第 15 章 详 细 讨 论 了 提供 rlogin 服务 的 步骤 。 


上 ， 即 可 得 到 图 19-3 中 所 示 的 安排 。telnetd 服务 器 使 用 类 似 的 安排 。 


在 rlogind 服务 器 和 登录 shell 之 间 有 两 个 exec 调用 ， 这 是 因为 Login 程序 通常 是 在 两 


个 exec 之 间 检 验 用 户 是 否 合 法 。 


图 19-3 的 一 个 关键 点 是 ， 驱 动 PTY 主 设备 的 进程 通常 同时 在 读 写 为 一 个 VO 流 。 本 例 中 为 
一 个 VO 流 是 TCP/IP 框 。 这 表示 该 进程 必然 使 用 了 某 种 形式 的 诸如 select R poll 这 样 的 IO 


多 路 转 接 〈 见 14.4 节 )， 或 者 被 分 成 两 个 进程 或 线程 。 


2. 窗口 系统 终端 模拟 


窗口 系统 通常 提供 一 个 终端 模拟 器 ， 这 样 我 们 就 能 在 熟悉 的 命令 行 环境 中 通过 shell 来 运行 程 
序 。 终 端 模拟 器 作为 shell 和 窗口 管理 器 之 间 的 媒介 。 每 个 shell 在 上 自己 的 窗口 中 执行 。 


《两 个 shell 运行 在 不 同窗 口 ) 如 图 19-4 所 示 。 


shell 将 自己 的 标准 输入 、 标 准 输出 、 标 准 错误 连接 到 PTY 的 从 设备 端 。 终 端 模拟 器 程序 打 


一 旦 登录 shell 运行 在 远 端 主机 


这 个 安排 


JF PTY 的 主 设备 。 终 端 模拟 器 除了 作为 窗口 子 系统 的 接口 ， 还 要 负责 模拟 一 种 特殊 的 终端 ， 这 


意味 着 它 需 要 根据 它 所 模拟 的 设备 类 型 来 响应 返回 码 。 这 些 码 列 在 termcap 和 terminfo 数据 


EP. 


717 
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19-4 ”窗口 系统 的 进程 安排 


当 用 户 改变 终端 模拟 器 窗口 的 大 小 时 , 窗口 管理 器 会 通知 终端 模拟 器 。 终端 模 拟 器 在 PTY 的 

主 设备 端 发 出 TIOCSWINSZ ioctl 命令 来 设置 从 设备 的 窗口 大 小 。 如 果 新 的 窗口 大 小 和 当前 的 
不 同 ， 内 核 会 发 送 一 个 SIGWINCH 信号 给 前 台 PTY 从 设备 的 进程 组 。 如 果 应 用 程序 在 窗口 大 小 

改变 时 需要 重 绘 屏 幕 ， 它 就 会 捕捉 这 个 SIGWINCH 信号， 然后 发 出 TIOCSWINSZ ioctl HOR 
得 新 的 屏幕 尺寸 并 重 绘 屏 幕 。 

3. script 程序 

script(1) 程 序 是 随 大 多 数 UNIX 系统 提供 的 ， 它 将 终端 会 话 期 间 的 所 有 输入 和 输出 信息 复 
制 到 一 个 文件 中 。 为 完成 此 工作 ， 该 程序 将 自己 转 于 终端 和 一 个 新 调用 的 登录 shell 之 间 。 图 19-5 
详细 描述 了 script 程序 有 关 的 交互 。 这 里 要 特别 指出 ，script 程序 通常 是 从 登录 shell 启动 的 ， 
该 shell 还 要 等 待 script 程序 的 终止 。 
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图 19-5 script 程序 
script 程序 运行 时 ， 位 于 PTY 从 设备 上 的 终端 行规 程 的 所 有 输出 都 将 复制 到 脚本 文件 中 
(通常 称 为 typescript)。 因 为 击 键 通常 由 该 行规 程 模块 回 显 ， 所 以 该 脚本 文件 也 包括 了 输入 的 
AX. 但是， 因为 键入 的 口令 不 会 回 显 ， 所 以 该 脚本 文件 不 会 包含 口令 。 


| 在 编写 本 书 第 1 版 时 ，Rich Stevens 用 script 程序 获取 实例 程序 的 输出。 这 样 避免 了 手工 复 
| 制程 序 输出 可 能 带 来 的 错误 。 但 是 ， 使 用 script 的 不 足 之 处 是 必须 处 理 脚本 文件 中 的 控制 字符 。 


在 19.5 节 开 发 了 通用 的 Pty 程序 后 , 我 们 将 看 到 使 用 pty 程序 和 一 个 简单 的 shell 脚本 就 能 
够 实现 一 个 新 版 本 的 script 程序 。 

4. expect 程序 

伪 终 端 可 以 用 来 在 非 交 互 模式 中 驱动 交互 式 程序 的 运行 。 许 多 硬 连 线程 序 需要 一 个 终端 才能 
运行 ，passwd(1) 命 令 就 是 一 个 例子 ， 它 要 求 用 户 在 系统 提示 后 输入 口令 。 

为 了 支持 批 处 理 操作 模式 而 修改 所 有 交互 式 程 序 是 非常 麻烦 的 ， 与 这 种 处 理 相 比 ， 一 个 更 好 
的 解决 方法 是 通过 一 个 脚本 来 驱动 交互 式 程序 。expect 程序 [Libes 1990, 1991, 1994] 提 供 了 这 样 
的 方法 。 类 似 于 19.5 节 的 pty 程序 ， 它 使 用 伪 终 端 来 运行 其 他 程序 。 并 且 ，expect 还 提供 了 一 
种 编程 语言 用 于 检查 运行 程序 的 输出 ， 以 确定 用 什么 作为 输入 发 送 给 该 程序 。 当 一 个 源 自 脚本 的 
交互 式 的 程序 正在 运行 时 ， 不 能 仅仅 是 将 脚本 中 的 所 有 内 容 复制 到 程序 中 去 ， 或 者 将 程序 的 输出 
送 至 脚本 ， 而 是 必须 要 向 程序 发 送 某 个 输入 ， 检 查 它 的 输出 ， 并 决定 下 一 步 发 送 给 程序 的 内 容 。 (720 

5. 运行 协同 进程 | 

在 图 15-19 所 示 的 协同 进程 的 例子 中 , 我 们 不 能 调用 使 用 标准 IO 库 进 行 输入 、 输 出 的 协同 进程 ， 
这 是 因为 当 通 过 管道 与 协同 进程 进行 通信 时 ， 标 准 VO 库 会 完全 缓冲 标准 输入 和 标准 输出 ， 从 而 引起 
死 锁 。 如 果 协 同 进程 是 一 个 已 经 编译 的 程序 而 我 们 又 没有 源 程序 ， 则 无 法 在 源 程 序 中 加 入 fflush 语 
句 来 解决 这 个 问题 。 图 15-16 显示 了 一 个 进程 驱动 协同 进程 的 情况 。 我 们 需要 做 的 是 将 一 个 伪 终 端 放 
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到 两 个 进程 之 间 〈 如 图 19-6 所 示 )， 诱 使 协同 进程 认为 它 是 由 终端 驱动 的 ， 而 非 另 一 个 进程 。 
协同 进程 


19-6 用 伪 终 端 驱动 一 个 协同 进程 

现在 协同 进程 的 标准 输入 和 标准 输出 就 像 终端 设备 一 样 ， 所 以 标准 VO 库 会 将 这 两 个 流 设 置 
成 行 缓冲 。 

父 进 程 有 两 种 方法 在 自身 和 协同 进程 之 间 获 得 伪 终 端 。 (这 种 情况 下 的 父 进 程 可 以 类 似 
图 15-18 中 的 程序 ,使 用 两 个 管道 和 协同 进程 进行 通信 。) 一 个 方法 是 ， 父 进程 直接 调用 pty_fork 
函数 CA 19.4 节 ) 而 不 是 调用 fork。 另 一 种 方法 是 ，exec 该 pty EF (A 19.5 节 )， 将 协同 
进程 作为 参数 。 我 们 将 在 给 出 pty 程序 后 介绍 这 两 种 方法 。 

6. 观看 长 时 间 运 行程 序 的 输出 

使 用 任何 一 个 标准 shell， 可 以 将 一 个 需要 长 时 间 运 行 的 程序 放 到 后 台 运 行 。 但 是 ， 如 果 将 该 
程序 的 标准 输出 重 定向 到 一 个 文件 ， 并 且 它 产生 的 输出 又 不 多 ， 那 么 我 们 就 不 能 方便 地 监控 程序 
的 进展 ， 因 为 标准 IO 库 将 完全 缓冲 它 的 标准 输出 。 我 们 看 到 的 将 只 是 标准 IO 库 函 数 写 到 输出 
文件 中 的 成 块 输出 ， 有 时 甚至 可 能 是 长 度 为 8 192 字 节 的 数据 块 。 

如 果 有 源 程序 , 则 可 以 加 入 fflush 调用 强制 标准 VO 缓冲 区 在 某 些 节点 冲洗 或 者 把 缓冲 模式 改 
成 使 用 setvbuf 的 行 缓冲 。 然 而 ， 如 果 没 有 源 程 序 ， 可 以 在 pty 程序 下 运行 该 程序 ， 让 标准 IO 库 
认为 标准 输出 是 终端 。 图 19-7 显示 了 这 个 安排 ,我们 将 这 个 缓慢 输出 的 程序 称 为 slowout。 从 登录 

shell 到 pty 进程 的 fort /exec 箭头 是 用 虚线 表示 的 , 为 的 是 强调 pty 进程 是 作为 后 台 任务 运行 的 。 





19-7 使 用 伪 终 端 运行 一 个 缓慢 输出 的 程序 
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19.3 ”打开 伪 终 端 设 备 


PTY 表现 得 就 像 物理 终端 设备 一 样 ， 因 此 应 用 程序 就 无 须 在 意 它 们 在 使 用 的 是 何 种 设备 。 然 
而 ， 在 打开 PTY 设备 文件 时 ， 应 用 程序 并 不 需要 设置 0O_TTY_INIT 标识 。Single UNIX Specification 
已 经 要 求 PLY 从 设备 端 第 一 次 被 打开 的 时 候 要 初始 化 ， 这 样 该 设备 正常 工作 所 需要 的 所 有 非 标 准 
termios 标识 就 都 被 设置 了 。 这 个 要 求 则 在 允许 PTY 设备 和 遵循 POSIX 的 调用 tcgetattr 和 
tcsetattr 的 应 用 程序 正确 地 运行 。 

各 种 平台 打开 伪 终 端 设备 的 方法 有 所 不 同 。 在 Single UNIX Specification 的 XSI 扩展 中 包含 了 
很 多 函数 ， 试 图 统一 这 些 方 法 。 这 些 函 数 的 基础 是 SVR4 用 于 管理 基于 STREAMS 的 伪 终 端的 一 
组 函数 。posix_openpt 孙 数 提供 了 一 种 可 移植 的 方法 来 打开 下 一 个 可 用 伪 终 端 主 设备 。 

#include <stdlib.h> 
#include «fcntl.h» 


int posix_openpt (int oflag); 





参数 oflag 是 一 个 位 屏蔽 字 ， 指 定 如 何 打开 主 设备 ， 它 类 似 于 open(2) 的 oflag oe 但 是 并 
不 支持 所 有 打开 标志 。 对 于 posix_openpt， 可 以 指定 O_RDWR 来 打开 主 设备 进行 读 、 写 ， 指 定 
o NocTTY 来 防止 主 设备 成 为 调用 者 的 控制 终端 。 其 他 打开 标志 都 会 导致 未 定义 的 行为 。 
在 伪 终 端 从 设备 可 用 之 前 ， 它 的 权限 必须 设置 ， 以 便 应 用 程序 可 以 访问 它 。grantpt 函数 提 
供 这 样 的 功能 : 它 把 从 设备 节点 的 用 户 ID 设置 为 调用 者 的 实际 用 户 D, RERA ID 为 一 非 指定 
值 , 通常 是 可 以 访问 该 终端 设备 的 组 。 权 限 被 设置 为 : 对 个 体 所 有 者 是 读 / 写 , 对 组 所 有 者 是 写 (0620)。 
实现 通常 将 PTY 从 设备 的 组 所 有 者 设置 为 tty 组 。 把 那些 要 对 系统 中 所 有 活动 终端 具有 写 
权限 的 程序 (如 wall(DAl write(1 的 设置 组 ID REA tty A. ANZ PTY 从 设备 上 tty 
组 的 写 权限 是 被 允许 的 ， 所 以 这 些 程序 就 可 以 向 活动 终端 写 入 。 
#include <stdlib.h> 
int grantpt(int fd); 


int unlockpt (int fd); 





为 了 更 改 从 设备 节点 的 权限 ，grantpt 可 能 需要 fork 并 exec _ BER ID 程序 (如 
在 Solaris 中 是 /usr/1ib/pt_chmod)。 于 是 ， 如 果 调 用 者 捕捉 到 SIGCHLD 信和 号， 那么 其 行为 
是 未 说 明 的 。 

unlockpt 函数 用 于 准予 对 伪 终 端 从 设备 的 访问 ， 从 而 允许 应 用 程序 打开 该 设备 。 阻 目 
其 他 进程 打开 从 设备 后 ， 建 立 该 设备 的 应 用 程序 有 机 会 在 使 用 主 、 从 设备 之 前 正确 地 初始 化 
这 些 设备 。 

注意 ， 在 grantpt 和 unlockpt 这 两 个 函数 中 ， 文 件 描 述 符 参数 是 与 伪 终 端 主 设备 关联 的 
文件 描述 符 。 

如 果 给 定 了 伪 终 端 主 设备 的 文件 描述 符 ， 那 么 可 以 用 ptsname 函数 找到 伪 终 端 从 设备 的 路 
径 名 。 这 使 应 用 程序 可 以 独立 于 给 定 平台 的 某 种 特定 约定 而 标识 从 设备 。 注 意 ， 该 函数 返回 的 名 
字 可 能 存储 在 静态 存储 中 ， 因 此 后 续 的 调用 可 能 会 覆盖 它 。 
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#include <stdlib.h> 


char *ptsname(int fd); 





图 19-8 总 结 了 Single UNIX Specification 中 的 伪 终 端 函数 ， KETENEN 4 种 平台 分 别 


73) 支持 哪些 函数 。 


FreeBSD Linux MacOS 
3.2.0 X 10.6.8 


grantpt 更 改 PTY 从 设备 的 权限 
posix openpt | 打开 一 个 PTY ERA 
ptsname 返回 PTY 从 设备 的 名 字 
unlockpt 允许 打开 PTY 从 设备 


图 19-8 XSI 擅 终 端 函数 


在 FreeBSD P, grantpt fe unlockpt 除了 参数 验证 外 不 执行 任何 操作 ，PTY 是 通过 正确 的 权限 
动态 地 创建 出 来 的 。 注 意 ，FreeBSD 定义 O_NOCTTY 标志 只 是 为 了 兼容 调用 posix openpt 的 应 用 程 
序 。 在 FreeBSD 中 打开 终端 设备 并 不 会 引起 分 配 控制 终端 的 副作用 ， 所 以 O_NOCTTY 标志 并 无 作用 。 


Single UNIX Specification 已 经 改善 了 此 方面 的 可 移植 性 ， 但 是 差距 仍然 存在 。 我 们 提供 了 两 
个 处 理 所 有 这 些 细节 的 函数 : ptym open 和 ptys open. ptym open 打开 下 一 个 可 用 的 PTY 
主 设备 ，ptys_open 打开 相应 的 从 设备 。 


#include "apue.h" 





int ptym open(char *pfs name, int pis namesz); 


返回 值 : AR, PTY 主 设备 文件 描述 符 ， 若 出 错 ， 返 回 -1 


int ptys open(char *pts_name); 





返回 值 ， 若 成 功 ， 返 回 PTY 从 设备 文件 描述 符 ; 若 出 错 ， 返 回 -1 


通常 ， 不 直接 调用 这 两 个 函数 ， 而 是 由 函数 pty fork (W 19.4 节 ) 调用 它们 ， 并 且 还 会 
fork 出 一 个 子 进程 。 

ptym open 函数 打开 下 一 个 可 用 的 PTY 主 设备 。 调 用 者 必须 分 配 一 个 数组 来 存放 主 设备 或 
从 设备 的 名 字 ， 并 且 如 果 调 用 成 功 ， 相 应 的 从 设备 名 会 通过 pts. name 返回 。 然 后， 这 个 名 字 传 给 
用 来 打开 该 从 设备 的 ptys_open 函数 。 缓 冲 区 的 字 节 长 度 由 prs namesz 传送 ， 使 得 ptym open 
函数 不 会 复制 比 该 缓冲 区 长 的 字符 串 。 

在 说 明 pty_fork 函数 之 后 ， 提 供 两 个 函数 来 打开 这 两 个 设备 的 原因 将 会 很 明显 。 通 常 ， 一 
个 进程 调用 ptym open 来 打开 一 个 主 设备 并 且 得 到 从 设备 名 。 该 进程 然后 fork THE, Tit 
程 在 调用 setsid 建立 新 的 会 话 后 调用 ptys open 打开 从 设备 。 这 就 是 从 设备 如 何 成 为 子 进程 
控制 终端 的 过 程 OLA 19-9). 
#include "apue.h" 
#include <errno,h> 
#include <fcntl.h> 
#if defined (SOLARIS) 


[724] #include <stropts.h> 
fendif 
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int 
ptym open(char *pts name, int pts namesz) 
{ 

char *ptr: 

int fdm, err; 


if ((fdm = posix openptí(O RDWR)) < 0) 
returní(-1); 


if (grantpt(fdm) < 0) /* grant access to slave */ 
goto errout; 

if (unlockpt(fdm) « 0) /* clear slave's lock flag */ 
goto errout; l 

if ((ptr = ptsname(fdm)) == NULL) /* get slave's name */ 


goto errout; 


/* 
* Return name of slave. Null terminate to handle 
* case where strlen(ptr) » pts namesz. 
ay 

strncpy(pts name, ptr, pts namesz); 

pts name[pts namesz - 1] = '\0'; 

return (fdm) ; /* return fd of master */ 

errout: 

err = errno; 

close (fdm); 

errno = err; 

return (-1); 


int 
ptys_open(char *pts_name) 
{ 

int fds; 
#if defined (SOLARIS) 

int err, setup; 
#endif 


if ((fds = open(pts_name, O_RDWR)) < 0) 
return(-1); 


#if defined (SOLARIS) 
/* 
* Check if stream is already set up by autopush facility. 
*/ 
if ({setup = ioctl(fds, I FIND, "ldterm")) < 0) 
goto errout; 


if (setup == 0) { 

if (ioctl(fds, I PUSH, "ptem") < 0) 
goto errout; 

if (ioctl(fds, I PUSH, "ldterm") < 0) 
goto errout; 

if (ioctl(fds, I PUSH, "ttcompat") « O) ( 

errout: 

err = errno; 
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close(fds); 
errno - err; 
returní-1); 


} 
#endif 
return (fds); 


} 
19-9 fend FF BK 

ptym_open 函数 用 XSI PTY 函数 找到 并 打开 一 个 未 被 使 用 的 PTY ERA, 并 初始 化 对 应 的 
PTY 从 设备 。ptys_open 函数 打开 的 是 PTY 从 设备 。 然 而 在 Solaris 系统 中 ， 在 PTY 从 设备 表 
现 得 像 个 终端 前 ， 我 们 可 能 需要 多 做 几 步 工作 。 

在 Solaris 中 ,打开 从 设备 后 , 我 们 可 能 需要 将 3 个 STREAMS 模块 压 入 从 设备 的 流 中 。 伪 终 
端 仿真 模块 (ptem) 和 终端 行规 程 模块 (ldterm) 合 在 一 起 像 一 个 真正 的 终端 一 样 工作 。 
ttcompat 提供 了 对 早期 系统 (如 V7、4BSD 和 Xenix) 的 ioctl 调用 的 兼容 性 。 这 是 一 个 可 选 
的 模块 ， 但 是 因为 对 于 网 络 登 录 ， 它 是 自动 压 入 的 ， 所 以 我 们 将 它 压 入 到 从 设备 的 流 中 。 

也 可 能 并 不 需要 压 入 这 3 个 模块 ， 其 原因 是 ， 它 们 可 能 已 经 位 于 流 中 。STREAMS 系统 支持 
一 种 称 为 autopush (自动 压 入 ) 的 工具 ， 它 允许 系统 管理 员 配置 一 张 模块 列表 ， 只 要 打开 一 个 特 
定 设 备 ， 就 将 这 些 模块 压 入 流 中 〈 详 见 Ragof1993])。 使 用 I FIND ioctl 命令 观察 ldterm 是 
否 已 在 流 中 。 如 果 是 ， 则 认为 该 流 已 用 autopush 机 制 配 置 ， 这 样 就 无 需 再 压 入 相应 模块 。 

Linux. Mac OS X 和 Solaris 都 遵循 历史 上 System V 的 行为 ， 如 果 调 用 者 是 一 个 还 没有 控制 
终端 的 会 话 首 进程 ， 这 个 打开 Copen) 的 调用 会 分 配 一 个 PTY 从 设备 作为 控制 终端 。 如 果 不 想 
让 这 种 情况 发 生 ， 可 以 在 打开 Copen) 时 设置 0_NOCTTY He. Ail, FreeBSD 中 ， 打 开 PTY 
从 设备 不 会 产生 分 配 其 作为 控制 终端 的 副作用 ， 下 一 节 将 探讨 如 何在 FreeBSD 中 分 配 控制 终端 。 


19.4 PAR pty fork 


现在 使 用 上 一 节 介 绍 的 两 个 函数 pt ym open 和 ptys open 来 编写 一 个 新 函数 ， 我 们 称 之 
为 pty_fork。 这 个 新 函数 具有 如 下 功能 : 用 fork 调用 打开 主 设备 和 从 设备 ， 创 建 作为 会 话 首 
进程 的 子 进 程 并 使 其 具有 控制 终端 。 


#include "apue.h" 


finclude <termios.h> 


pid t pty fork(int *ptrfdm, char *slave name, int slave namesz, 


const struct termios *slave termios, 
const struct winsize *slave winsize) ; 


返回 值 ， 子 进程 中 返回 0， 父 进程 中 返回 子 进程 的 进程 ID， 若 出错 ， 返 回 -1 
PTY 主 设备 的 文件 描述 符 通过 ptrfiim 指针 返回 。 
如 果 slave name 不 为 空 ， 从 设备 名 被 存储 在 该 指针 指向 的 存储 区 中 。 亩 用 者 必须 为 该 存储 区 
分 配 空间 。 
如 果 指 针 slave termios 不 为 字 ， 则 系统 使 用 该 指针 所 引用 的 结构 初始 化 从 设备 的 终端 行规 程 。 
如 果 该 指针 为 空 ， 那么 系统 将 会 把 从 设备 的 termios 结构 设置 成 实现 定义 的 初始 状态 。 类 似 地 ， 
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如 果 slave winsize 指针 不 为 空 ， 那 么 按 该 指针 所 引用 的 结构 初始 化 从 设备 的 窗口 大 小 。 如 果 该 指 
针 为 空 ， winsize 结构 通常 被 初始 化 为 0。 

19-10 显示 了 该 函数 的 代码 。 它 调用 相应 的 ptym_open Ml ptys open MR, 在 本 书 讨论 
的 4 种 平台 上 ，pty_fork 函数 都 能 工作 。 


#include "apue.h" 
#include <termios.h> 


pid t 

pty fork(int *ptrfdm, char *slave name, int slave namesz, 
const struct termios *slave termios, 
const struct winsize *slave winsize) 


int fdm, fds; 
pid t pid: 
char pts. name [20]; 


if ((fdm = ptym open(pts name, sizeof(pts name))) < 0) 
err sys("can't open master pty: %s, error td", pts name, fdm); 


if (slave name != NULL) { 
/* 
* Return name of slave. Null terminate to handle case 
* where strlen(pts name) » slave namesz. 


i i 
strncpy(slave name, pts name, slave, namesz); 
slave name[slave namesz - 1] = '\0O'; 


if ((pid = fork()) < 0) { 
return(-1); 
} else if (pid == 0) I /* child */ 
if (setsid() < 0) 
err Sys("setsid error"); 


/* 
* System V acquires controlling terminal on open(). 
*/ 
if ((fds = ptys_open(pts_name)) < 0) 
err sys("can't open slave pty"); 
close (fdm) ; /* all done with master in child */ 


#if defined (BSD) 
/* 
* TIOCSCTTY is the BSD way to acquire a controlling terminal. 
*/ 
if (ioctl(fds, TIOCSCTTY, (char *)0) < 0} 
err Sys("TIOCSCTTY error"); 
$endif 
/* 
* Set slave's termios and window size. 
*/ 
if (slave termios != NULL) { 
if (tcsetattr(fds, TCSANOW, slave termios) < 0) 
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err sys("tcsetattr error on slave pty"); 
} 
if (slave winsize != NULL) { 
if (ioctl(fds, TIOCSWINSZ, slave winsize) < 0) 
err Sys("TIOCSWINSZ error on slave pty"); 
} 


/* 
* Slave becomes stdin/stdout/stderr of child. 
+f 
if (dup2(fds, STDIN FILENO) != STDIN, FILENO) 
err Sys("dup2 error to stdin"); 
if (dup2(fds, STDOUT FILENO) !- STDOUT FILENO) 
err sys("dup2 error to stdout"); 
if (dup2(fds, STDERR FILENO) !- STDERR FILENO) 
err sys("dup2 error to stderr"); 
if (fds != STDIN FILENO && fds != STDOUT FILENO && 
fds !- STDERR, FILENO) 


close (fds); 
return (0); /* child returns 0 just like fork() */ 
} else { /* parent */ 
*ptrfdm = fdm; /* return fd of master */ 
return (pid); /* parent returns pid of child */ 


19-10 pty_fork 函数 

在 打开 PTY 主 设备 后 , 调用 fork. 正如 前 面 提 到 的 , 子 进程 先 调用 setsid 建立 新 的 会 话 ， 
然后 才 调 用 ptys_open。 当 调用 setsid 时 ， 子 进程 还 不 是 一 个 进程 组 的 首 进程 ， 因 此 执行 9.5 
节 中 列 出 的 3 个 操作 步骤 : GO 子 进程 创建 一 个 新 的 会 话 ， 它 是 该 会 话 的 首 进 程 ; (b) 子 进程 创 
建 一 个 新 的 进程 组 ; (c) 子 进程 其 开 与 以 前 可 能 有 的 控制 终端 的 关联 ， 于 是 不 再 有 控制 终端 。 在 
Linux, Mac OS X 和 Solaris 系统 中 ， 当 调用 Ptys_open 时 ， 从 设备 成 为 新 会 话 的 控制 终端 。 在 
FreeBSD 系统 中 ， 必 须 调用 TIOCSCTTY ioctl 来 分 配 一 个 控制 终端 (回想 图 9-8， 其 他 3 个 平 
台 也 支持 TIOCSCTTY ioctl 命令 ， 但 是 只 有 在 FreeBSD 中 需要 我 们 去 调用 它 。) 

termios 和 winsize 这 两 个 结构 在 子 进程 中 初始 化 。 最 后 从 设备 的 文件 描述 符 被 复制 到 子 
进程 的 标准 输入 、 标 准 输出 和 标准 错误 中 。 这 意味 着 不 管子 进程 以 后 调用 exec 执行 何 种 程序 ， 
它 都 具有 同 PTY 从 设备 (其 控制 终端 ) 联系 起 来 的 上 述 3 个 描述 符 。 

在 调用 fork 后 ， 父 进程 返回 PTY 主 设备 的 描述 符 以 及 子 进 程 的 进程 ID。 下 一 节 将 在 pty 
程序 中 使 用 pty_fork AR. 


19.5 pty 程序 


编写 Pty 程序 的 目的 是 用 
pty prog argl arg2 
来 代替 


prog argl arg2 


195 pty HR 591 


当 用 pty 来 执行 另 一 个 程序 时 ， 那 个 程序 在 一 个 它 自己 的 会 话 中 执行 ， 并 和 一 个 伪 终 端 连接 。. 
让 我 们 查看 pty 程序 的 源 代 码 。 第 一 个 文件 〈 见 图 19-11) 包含 main BR. 它 调用 上 一 节 
的 pty_fork AR. 


#include "apue.h" 
#include «termios.h» 


#ifdef LINUX 
#define OPTSTR "+d:einv" 


#else 

#define OPTSTR "d:einv" 

#endif 

static void set noecho(int); /* at the end of this file */ 
void do driver(char *); /* in the file driver.c */ 
void loop(int, int); /* in the file loop.c */ 

int 


main(int argc, char *argv[]) 
f 


int fdm, c, ignoreeof, interactive, noecho, verbose; 

pid_t pid; 727 
char *driver; l 
char Slave name[20]; 729 
struct termios orig termios; 

struct winsize size; 


interactive - isatty(STDIN FILENO); 
ignoreeof = 0; 

noecho = 0; 

verbose = 0; 

driver = NULL; 


opterr = 0; /* don't want getopt() writing to stderr */ 
while ((c = getopt(argc, argv, OPTSTR)) != EOF) { 
switch (c) { 


case 'd': /* driver for stdin/stdout */ 
driver = optarg; 
break; 

case ‘et: /* noecho for slave pty's line discipline */ 
noecho = 1; 
break; 

case 'i': /* ignore EOF on standard input */ 
ignoreeof = 1; 
break; 

case 'n': /* not interactive */ 
interactive = 0; 
break; 

case 'v': /* verbose */ 


verbose = l1; 
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break; 


case '?'i 





err_quit ("unrecognized option: -$c", optopt); 


) 
if (optind >= argc) > 


err_quit("usage: pty [ -d driver -einv ] program [ arg ... 1"); 


if (interactive) ( 


/* fetch current termios and window size */ 


if (tcgetattr(STDIN FILENO, &orig termios) « O0) 
err sys("tcgetattr error on stdin"); 
if (ioctl(STDIN FILENO, TIOCGWINSZ, (char *) &size) < 0) 
err sys("TIOCGWINSZ error"); 
pid = pty fork(&fdm, slave name, sizeofí(slave name), 
&orig termios, &size); 


) else ( 


pid = pty fork(&fdm, slave name, sizeof (slave name), 


NULL, NULL); 


if (pid < 0) { 


err sys("fork error"); 


} else if (pid == 0) { 
if (noecho) 


/* child-*/ 


set noecho(STDIN FILENO):; /* stdin is slave pty */ 


if (execvp(argv[optind], &argv[optind]) < 0) 
err sys("can't execute: %s", argv[optind]); 


if (verbose) { 


fprintf(stderr, "slave name = %s\n", slave name); 
if (driver != NULL) 
fprintf(stderr, "driver = s\n", driver); 


if (interactive && driver == NULL) { 


if (tty_raw(STDIN_ 


FILENO) < 0) /* user's tty to raw mode */ 


err_sys("tty_raw error"); 
if (atexit(tty atexit) < 0) /* reset user's tty on exit */ 
err sys("atexit error"); 


if (driver) 
do driver(driver); 


loop(fdm, ignoreeof); 


exit(0); 


static void 


set noecho(int fd) 
{ 


/* changes our stdin/stdout */ 


/* copies stdin -» ptym, ptym -» stdout */ 


/* turn off echo (for slave pty) */ 


19.5 pty 程序 593 


struct termios stermios; 


if (tcgetattr(fd, &stermios) < 0) 
err sys("tcgetattr error"); 


stermios.c lflag &- -(ECHO | ECHOE | ECHOK | ECHONL); 


/* 
* Also turn off NL to CR/NL mapping on output. 
*/ 

stermios.c oflag &= -(ONLCR); 


if (tcsetattr(fd, TCSANOW, &stermios) < 0) 
err Sys("tcsetattr error"); 


19-11 pty 程序 的 main 函数 

下 一 节 介 绍 pty 程序 的 不 同 用 途 时 ， 将 看 到 多 种 命令 行 选项 。getopt 函数 帮助 我 们 以 协调 
一 致 的 模式 分 析 命 令 行 参 数 。 为 了 在 Linux 系统 中 强制 POSIX 行为 ,我们 将 选项 字符 串 的 第 一 个 
字符 设置 为 加 号 。 731 

在 调用 pty_fork 前 ， 我 们 获取 termios 和 winsize 结构 的 当前 值 ， 将 其 作为 参数 传递 
给 pty_fork。 通 过 这 种 方法 ，PTY 从 设备 具有 和 当前 终端 相同 的 初始 状态 。 

子 进程 从 pty_fork 返回 后 ， 可 选 地 关闭 了 PTY 从 设备 的 回 显 ， 然 后 调用 execvp 来 执行 
命令 行 指定 的 程序 。 所 有 余下 的 命令 行 参数 将 成 为 该 程序 的 参数 。 

父 进程 可 选 地 将 用 户 终端 设置 为 原始 模式 。 在 这 种 情况 下 ， 父 进程 还 要 设置 退出 处 理 程 序 ， 
使 得 在 调用 exit 时 复原 终端 状态 。 下 一 节 将 描述 do driver 函数 。 

接 下 来 ， 父 进程 调用 函数 loop (LA 19-12)， 该 函数 仅仅 是 将 从 标准 输入 接收 到 的 所 有 内 
容 复制 到 PTY 主 设备 ， 并 将 PTY 主 设备 接收 到 的 所 有 内 容 复 制 到 标准 输出 。 尽 管 使 用 select 
BÉ poll 的 单 进程 或 多 线程 是 可 行 的 ， 但 是 为 了 有 所 变化 ， 这 里 使 用 了 两 个 进程 。 


#include "apue.h" 
#define BUFFSIZE 512 


Static void sig term(int); 
static volatile sig atomic t | sigcaught; /* set by signal handler */ 


void 
loop(int ptym, int ignoreeof) 
{ 

pid_t child; 

int nread; 

char buf [BUFFSIZE]; 


if ((child = fork()) < 0) { 
err sys("fork error"); 
} else if (child == 0) { /* child copies stdin to ptym */ 
fot C7 $) í 
if ((nread = read(STDIN FILENO, buf, BUFFSIZE)) < 0) 
err sys("read error from stdin"); 
else if (nread == 0) 
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break; /* EOF on stdin means we're done */ 
if (writen(ptym, buf, nread) != nread) 
err sys("writen error to master pty"); 


/* 
* We always terminate when we encounter an EOF on stdin, 
* but we notify the parent only if ignoreeof is 0. 
*/ 
if (ignoreeof == 0) 
kill(getppid(), SIGTERM); /* notify parent */ 
exit(0); /* and terminate; child can't return */ 


/* 
* Parent copies ptym to stdout. 
xy 
if (signal intr(SIGTERM, sig term) -- SIG ERR) 


err sys("signal intr error for SIGTERM"); 


for (; 3) { 
if ((nread = read(ptym, buf, BUFFSIZE)) <= 0) 
break; /* signal caught, error, or EOF */ 
if (writen(STDOUT FILENO, buf, nread) !- nread) 
err Ssys("writen error to stdout"); 


/* 
* There are three ways to get here: sig term() below caught the 
* SIGTERM from the child, we read an EOF on the pty master (which 
* means we have to signal the child to stop), or an error. 
*/ 
if (sigcaught == 0) /* tell child if it didn't send us the signal */ 
kill(child, SIGTERM); 


/* 
* Parent returns to caller. 
*/ 


/* 
* The child sends us SIGTERM when it gets EOF on the pty slave or 
* when read() fails. We probably interrupted the read() of ptym. 
sy 
static void 
sig term(int signo) 


i 
sigcaught - 1; /* just set flag and return */ 





图 19-12 loop 函数 
注意 ， 因 为 使 用 了 两 个 进程 ， 所 以 一 个 终止 时 ， 必 须 通 知 男 一 个 。 我 们 用 SIGTERM fii 5 xt 
行 这 种 通知 。 
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接 下 来 看 几 个 pty 程序 的 应 用 实例 ， 并 了 解 使 用 不 同 命令 行 选项 的 必要 性 。 
如 果 使 用 Kom shell， 那 么 我 们 执行 命令 : 


pty ksh 


会 得 到 一 个 运行 在 伪 终 端 下 的 全 新 shell. 
如 果 文件 ttyname 包含 了 图 18-16 中 所 示 的 程序 ， 那 么 可 按 如 下 模式 执行 pty 程序 : 75 


$ who 

sar console May 19 16:47 
sar ttys000 May 19 16:47 
sar ttysOOI May 19 16:48 
sar ttys002 May 19 16:48 
sar ttys003 May 19 16:49 


sar ttys004 May 19 16:49 ttys004 是 当前 使 用 的 最 高 PTY 设备 
$ pty ttyname 在 PTY 上 运行 图 18-16 中 的 程序 
fd 0: /dev/ttys005 ttys005 是 下 一 个 可 用 的 PTY 


fd 1: /dev/ttys005 
fd 2: /dev/ttys005 


1. utmp 文件 

6.8 节 讨 论 过 记录 当前 登录 到 UNIX 系统 的 用 户 的 utmp 文件 。 那 么 在 伪 终 端 上 运行 程序 的 用 
户 是 否 被 认为 是 登录 了 了 呢 ? 如 果 是 用 telnetd 和 rlogind 远程 登录 ， 显 然 在 伪 终 端 上 登录 的 用 
户 应 该 在 utmp 文件 中 有 相应 记录 项 。 但 是 ,通过 窗口 系统 或 script 类 程序 在 伪 终 端 上 运行 shell 
的 用 户 是 否 应 该 在 utmp 文件 中 有 相应 记录 项 呢 ? 有 的 系统 有 记录 ， 有 的 没有 。 如 果 在 utmp X 
件 中 没有 记录 的 话 ，who(1) 程 序 一 般 不 会 显示 相应 伪 终 端正 在 被 使 用 。 

除非 utmp 文件 允许 其 他 用 户 的 写 权限 (这 被 认为 是 一 个 安全 漏洞 ), 否则 一 般 使 用 伪 终 端的 
程序 将 不 能 对 utmp 文件 进行 写 操作 。 

2. 作业 控制 交互 

当 在 pty 下 运行 作业 控制 shell 时 ， 它 能 够 正常 地 运行 。 例 如 ， 


pty ksh 


将 在 pty 下 运行 Kom sheli。 我 们 能 够 在 这 个 新 shell 下 运行 程序 并 使 用 作业 控制 ， 这 如 同 在 登录 
shell 中 一 样 。 但 如 果 在 pty 下 运行 一 个 交互 式 程序 而 不 是 作业 控制 shell， 例 如 ， 

pty cat 
那么 在 键入 作业 控制 挂 起 字符 之 前 该 程序 的 运行 一 切 正常 。 而 在 键入 作业 控制 挂 起 字符 时 ， 作 业 
控制 挂 起 字符 将 会 被 显示 为 ^2， 并 且 被 忽略 。 在 早期 基于 BSD 的 系统 中 ，cat 进程 终止 ，pty 
进程 终止 ， 回 到 初始 登录 shell。 为 了 明白 其 中 的 原因 ， 我 们 需要 检查 所 有 相关 的 进程 以 及 这 些 进 
程 所 属 的 进程 组 和 会 话 。 图 19-13 显示 了 pty cat 运行 时 的 安排 。 

键入 挂 起 字符 (Ctrl+Z) 时 ， 它 被 cat 进程 下 的 行规 程 模块 所 识别 ， 这 是 因为 pty 将 终端 (在 
pty 父 进 程 之 下 ) 设置 为 原始 模式 。 但 内 核 不 会 停止 cat 进程 ， 这 是 因为 它 属于 一 个 孤儿 进程 组 
( 见 9.10 节 )。cat 的 父 进程 是 pty 父 进程 ， 它 属于 另 一 个 会 话 。 
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19-13 pty cat 的 进程 组 和 会 话 

历史 上 ， 不 同 的 系统 处 理 这 种 情况 的 方法 也 不 同 。POSIX.1 只 是 说 明 SIGTSTP 信号 不 能 被 
发 送 给 进程 。4.3BSD 的 派生 系统 向 进程 递送 一 个 它 从 不 捕获 的 SIGKILL 信号 。4.4BSD RAK 
用 发 送 SIGKILL 信号 的 方法 ， 转 而 采用 符合 于 POSIX. 的 处 理 方法 。 如 果 SIGTSTP 信号 具有 
默认 配置 ， 并 且 传 递 给 孤儿 进程 组 中 的 一 个 进程 ， 那么 4.4BSD 的 内 核 会 无 声息 地 丢弃 SIGTSTP 
信号 。 大 多 数 当前 的 实现 都 采用 这 种 处 理 模 式 。 

当 我 们 使 用 pty 来 运行 作业 控制 shell 时 ， 被 这 个 新 shell 调用 的 作业 决 不 会 是 任何 孤儿 进程 
组 的 成 员 ， 这 是 因为 作业 控制 shell 总 是 属于 同一 个 会 话 。 在 这 种 情况 下 ， 键 入 的 Ctrl+Z 被 发 送 
到 由 shell 调用 的 进程 ， 而 不 是 shell 本 身 。 

让 pty 调用 的 进程 能 够 处 理 作 业 控 制 信号 的 唯一 的 方法 是 : 另外 增加 一 个 Pty 命令 行 标志 ， 
使 pty 子 进程 自己 能 够 识别 作业 挂 起 字符 (在 pty 子 进程 中 )， 而 不 是 让 该 字符 穿越 所 有 路 程 而 
到 达 另 一 个 行规 程 模块 。 

3. 检查 长 时 间 运 行程 序 的 输出 

另 一 个 使 用 pty 进行 作业 控制 交互 的 实例 见 图 19-7。 如 果 运 行 一 个 缓慢 产生 输出 的 程序 : 

pty slowout > file.out & 
当 子 进程 试图 从 标准 输入 〔 终 端 ) 读 入 数据 时 ，pty 进程 立刻 停止 运行 。 这 是 因为 该 作业 是 一 个 
后 台 作 业 , 并 且 当 它 试图 访问 终端 时 会 使 作业 控制 停止 。 如 果 将 标准 输入 重 定向 使 得 pty RAK 
端 读 取 数 据 ， 如 : 

pty slowout < /dev/null > file.out & 
那么 pty 程序 也 立即 停止 , 因为 它 从 标准 输入 和 终端 读 取 到 一 个 文件 结束 符 。 解决 这 个 问题 的 方 
法 是 使 用 -i 选项 ， 这 个 选项 的 含义 是 忽略 来 自 标准 输入 的 文件 结束 符 : 

pty -i slowout < /dev/null > file.out & 
这 个 标志 导致 在 遇 到 文件 结束 符 时 , 图 19-13 的 pty 子 进程 退出 , 但 子 进程 不 会 告诉 父 进 程 终止。 
相反 ， 父 进程 一 直 将 PTY 从 设备 的 输出 复制 到 标准 输出 〈 本 例 中 是 文件 file.out)。 
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4. script 程序 

使 用 pty 程序 可 以 把 script(1) 程 序 实 现成 下 面 shell 脚本 : 
#!/bin/sh 

pty "S(SHELL:-/bin/sh)" | tee typescript 


一 旦 执行 这 个 shell 脚本 ， 即 可 执行 ps 命令 来 观察 进程 之 间 的 关系 。 图 19-14 详细 地 显示 了 这 些 
关系 。 


typescript 
文件 





图 19-14 script shell 脚本 的 进程 安排 736 


在 这 个 例子 中 ， 假 设 SHELL 变量 是 Korn shell (可 能 是 /bin/ksh)。 如 前 面 所 述 ，script 
仅仅 是 将 新 的 shell. (和 它 调用 的 所 有 的 子 进程 的 输出 复制 出 来 ， 但 是 因为 PTY 从 设备 上 的 行 
规程 模块 通常 允许 回 显 ， 所 以 绝 大 多 数 键入 也 都 被 写 到 typescript 文件 中 。 

5. 运行 协同 进程 

在 图 15-8 所 示 的 程序 中 ， 协 同 进程 不 能 使 用 标准 IO 函数 ， 其 原因 是 标准 输入 和 标准 输出 不 
是 终端 ， 所 以 标准 IO 函数 会 将 它们 放 到 缓冲 区 中 。 如 果 把 


if (execl("./add2", "add2", (char *)0) « 0) 


替换 成 


if (execl("./pty", "pty", "-e", "add2", (char *)0) < O) 


在 pty 下 运行 协同 进程 ， 该 程序 即使 使 用 了 标准 VO 仍然 可 以 正确 运行 。 

19-15 显示 了 在 使 用 伪 终 端 作为 协同 进程 的 输入 和 输出 时 ， 进 程 的 安排 。 这 是 图 19-6 的 扩 
充 ， 它 显示 了 所 有 的 进程 连接 和 数据 流 。 框 中 的 “驱动 程序 ”是 按 前 面 的 说 明 更 改 了 execi 的 
图 15-8 的 程序 。 

这 一 实例 显示 了 -e《〈 不 回 显 ) 选项 对 于 pty 程序 的 重要 性 。 因 为 pty 程序 的 标准 输入 没有 
连接 到 终端 ， 所 以 它 不 以 交互 方式 运行 。 在 图 19-11 BRP, interactive 标志 默认 为 假 ， 这 
是 因为 对 isatty 调用 的 返回 是 假 。 这 意味 着 真正 终端 上 的 行规 程 保持 在 规范 模式 下 ， 并 人 允许 回 
显 。 指 定 -e 选项 后 ， 关 掉 了 PTY 从 设备 上 的 行规 程 模块 的 回 显 。 如 果 不 这 样 做 ， 则 键入 的 每 一 
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个 字符 都 将 被 两 个 行规 程 模 块 各 回 显 一 次 。 


fork, exec 





图 19-15 ”运行 一 个 协同 进程 ， 以 伪 终 端 作为 其 输入 和 输出 

还 能 用 -e 选项 关闭 termios 结构 的 ONLCR 标志 ， 以 防止 所 有 协同 进程 的 输出 被 回 车 和 换 
行 符 终止 。 

在 不 同 的 系统 上 测试 这 个 例子 ， 会 遇 到 14.7 节 中 描述 readn 和 writen 函数 时 顺便 提 到 的 
同样 问题 。 当 描述 符 引 用 的 不 是 普通 磁盘 文件 时 ， 从 read 返回 的 数据 量 可 能 会 因 两 个 实现 之 间 
的 不 同 而 有 所 区 别 。 使 用 pty 的 协同 进程 实例 产生 了 非 预期 的 结果 ， 其 原因 可 追 淹 至 图 15-18 的 
程序 中 读 管道 的 read 函数 ， 它 返回 的 结果 不 足 一 行 。 解 决 方法 是 不 使 用 图 15-18 中 的 程序 ， 而 
是 要 使 用 来 自 于 习题 15.5 针对 这 个 程序 的 另外 一 个 版 本 ， 这 个 版 本 改 用 标准 YO 库 ， 将 两 个 管道 
的 标准 IO 流 都 设置 为 行 缓冲 。 这样, fgets 函数 将 会 读 完 一 个 整 行 .图 15-18 的 程序 中 的 while 
循环 假设 发 送 到 协同 进程 的 每 一 行 都 会 带 来 一 行 的 返回 结果 。 

6. 非 交 互 地 驱动 交互 式 程序 

虽然 让 pty 运行 任意 协同 进程 ， 甚 至 交互 式 的 协同 进程 的 想法 很 诱 人 ， 但 这 是 行 不 通 的 。 问 
BET pty 只 是 将 其 标准 输入 复制 到 PTY， 并 将 来 自 PTY 的 数据 复制 到 其 标准 输出 ， 而 并 不 关 
心 具 体 发 送 的 或 得 到 的 是 什么 数据 。 

举 个 例子 ， 我 们 可 以 在 pty 下 运行 telnet 命令 ， 直 接 与 远程 主机 对 话 : 


pty telnet 192.168.1.3 


这 样 做 与 直接 键入 telnet 192.168.1.3 相 比 ， 并 没有 带 来 更 多 的 好 处 ， 但 我 们 可 能 希望 在 一 个 
脚本 中 运行 telnet 程序 ,其 目的 很 可 能 是 要 检验 远程 主机 的 某 个 条 件 。 如 果 telnet . cmd 文件 包 
fa Fil 477: 

md 

uptime 

exit 


第 1 行 是 登录 到 远程 主机 时 使 用 的 用 户 名 ， 第 2 行 是 口令 ， 第 3 行 是 希望 运行 的 命令 ， 第 4 行 终 
止 此 会 话 。 如 果 按 下 列 方 式 运行 此 脚本 : 
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pty -i < telnet.cmd telnet 192.168.1.3 


那么 ， 它 不 会 像 我 们 所 想 的 那样 操作 。 而 是 ，telnet .cmd 文件 的 内 容 在 还 没有 得 到 机 会 提示 
我 们 输入 账户 名 和 口令 之 前 ， 就 被 发 送 到 了 远程 主机 。 当 它 关 闭 问 显 而 读 口令 时 ，1login 使 
用 tcsetattr 选项 ， 于 是 丢弃 了 已 在 队列 中 的 所 有 数据 。 这 样 一 来 ， 我 们 发 送 的 数据 就 被 
ERT. 

当 以 交互 方式 运行 telnet 程序 时 ， 我 们 等 待 远程 主机 发 出 输入 口令 的 提示 ， 然 后 再 键入 口 
4, 但 是 pty 程序 不 知道 这 样 做 。 这 就 是 需要 一 个 比 pty 更 巧妙 的 程序 ， 如 expect， 从 脚本 文 
件 驱 动 交 互 式 程 序 的 原因 。 

即使 如 前 所 示 那 样 从 图 15-18 程序 运行 pty， 这 也 没有 任何 帮助 。 因 为 图 15-18 中 的 程序 认 
为 它 在 一 个 管道 写 入 的 每 一 行 都 会 在 另 一 个 管道 产生 一 行 。 对 于 一 个 交互 式 程 序 ， 输 入 一 行 可 能 
产生 多 行 输 出 。 更 进一步 ， 图 15-18 中 的 程序 在 从 协同 进程 读 之 前 ， 它 总 是 先 发 送 一 行 给 该 进程 。 
如 果 想 在 发 送 给 协同 进程 一 些 数 据 之 前 从 协同 进程 处 读 ， 这 种 策略 就 行 不 通 了 。 

有 一 些 从 shell 脚本 驱动 交互 式 程序 的 方法 ,可 以 在 pty 上 增加 一 种 命令 语言 和 一 个 解释 
器 。 但 是 一 个 适当 的 命令 语言 可 能 十 倍 于 pty 程序 的 大 小 。 另 一 种 选择 是 使 用 命令 语言 并 用 
pty fork 函数 来 调用 交互 式 程序 ， 这 正 是 expect 程序 所 做 的 。 

我 们 将 采用 一 种 不 同 的 途径 ， 使 用 选项 -da 使 pty 程序 的 输入 和 输出 与 驱动 进程 连接 起 来 。 
该 驱动 进程 的 标准 输出 是 pty 的 标准 输入 ， 反 之 亦 然 。 这 有 点 像 协 同 进程 ， 只 是 在 pty fH “SH 
一 边 ”。 此 种 进程 结构 与 图 19-15 中 所 示 的 几乎 相同 ， 只 是 在 这 种 场景 中 ， 由 Pty 来 完成 驱动 进 
FE fork 和 exec。 而 且 我 们 在 pty 和 驱动 进程 二 者 之 间 使 用 的 是 一 个 双向 的 流 管道 ， 而 不 是 
两 个 半 双 工 管道 。 

19-16 展示 的 是 do, driver 函数 的 源 代码 ， 在 使 用 -da 选项 时 ,该 函数 由 pty《 见 图 19-11) 
的 main 函数 调用 。 


#include "apue.h" 


void 
do driver(char *driver) 
{ 

pid_t child; 


int pipe [2]; 

/* 
* Create a full-duplex pipe to communicate with the driver. 
*/ 


if (fd_pipe(pipe) < 0) 
err sys("can't create stream pipe"); 


if ((child - fork()) « 0) ( 
err Sys("fork error"); 

) else if (child == 0) ( /* child */ 
close (pipe[1]); 


/* stdin for driver */ 
if (dup2(pipe[0], STDIN FILENO) !- STDIN FILENO) 
err sys("dup2 error to stdin"); 
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/* stdout for driver */ 


if (dup2(pipe[0], STDOUT FILENO) != STDOUT FILENO) 
err Sys("dup2 error to stdout"); 
if (pipe[0] != STDIN FILENO && pipe(0] != STDOUT FILENO) 


close (pipe[0]); 


/* leave stderr for driver alone */ 
execlp(driver, driver, (char *)0); 
err Ssys("execlp error for: 5s", driver); 


} 


close (pipe[0]); /* parent */ 

if (dup2(pipe[1], STDIN FILENO) !- STDIN FILENO) 
err sys("dup2 error to stdin"); 

if (dup2(pipe[1], STDOUT FILENO) !- STDOUT FILENO) 
err sys("dup2 error to stdout"); 

if (pipe[1] != STDIN FILENO && pipe(l] !- STDOUT FILENO) 
close (pipe[1]): 


/* 

* Parent returns, but with stdin and stdout connected 
* to the driver. 

*/ 


19-16 pty 程序 的 do driver 函数 
通过 我 们 自己 编写 由 pty 调用 的 驱动 程序 , 可 以 按 我 们 所 希望 的 方式 驱动 交互 式 程序 。 即 使 
驱动 程序 有 和 pty 连接 在 一 起 的 标准 输入 和 标准 输出 ， 驱 动 进程 仍然 可 以 通过 读 、 写 /dev/tty 
同 用 户 交 互 。 这 个 解决 方法 仍 不 如 expect 程序 通用 ， 但 是 它 用 不 到 50 行 的 代码 提供 了 pty 的 
一 种 实用 的 选项 。 


19.7 ”高 级 特性 


伪 终 端 还 有 其 他 特性 ， 我 们 在 这 里 简略 提 一 下 。Sun Microsystems[2002]# BSD pt s(4) 的 手 
册页 对 此 有 更 详细 的 说 明 。 

1. 打包 模式 

ITERA (packet mode) 能够 使 PTY 主 设备 了 解 到 PTY 从 设备 的 状态 变化 。 在 Solaris 系 
统 中 ， 可 以 通过 将 STREAMS 模块 pckt 压 入 PTY 主 设备 端 来 设置 这 种 模式 。 图 19-2 显示 了 
这 种 可 选 模块 。 在 FreeBSD. Linux 和 Mac OS X 中 ， 可 以 用 TIOCPKT ioctl 命令 来 设置 这 
种 模式 。 

Solaris 和 其 他 平台 相 比 较 ， 有 具体 的 打包 模式 有 所 不 同 。 在 Solaris 中 ， 读 取 PTY 主 设 备 的 进 
程 必须 调用 getmsg 从 流 首 取得 消息 ， 这 是 因为 pckt 模块 将 一 些 事件 转化 成 了 无 数据 的 
STREAMS 消息 。 在 其 他 平台 中 ， 每 一 次 对 PTY 主 设备 的 读 操 作 都 会 返回 带 有 可 选 数据 的 状态 字 节 。 

无 论 实现 细节 如 何 ， 打包 模式 的 目的 是 ， 当 PTY 从 设备 上 的 行规 程 模块 出 现 以 下 事件 时 ， 通 
知 进程 从 PTY 主 设备 读 取 数据 读 队列 被 冲洗 ， 写 队列 被 冲洗 ， 输 出 被 停止 《如 Cris), Hd 
重新 开始 ，XON/XOFF 流 控 制 被 禁用 后 重新 启用 ，XON/XOFF 流 控制 被 启用 后 重新 禁用 。 这 些 
事件 由 rlogin 客户 进程 和 rlogind 服务 器 进程 使 用 。 
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2. 远程 模式 

PTY 主 设备 可 以 用 TIOCREMOTE ioctl 命令 将 PTY 从 设备 设置 成 远程 模式 。 虽 然 FreeBSD、 
Mac OS X 10.6.8 和 Solaris 10 使 用 同样 的 命令 来 启用 或 禁用 这 个 特性 ， 但 是 在 Solaris FP, ioctl 
的 第 三 个 参数 是 一 个 整 型 数 ， 而 在 Mac OS X 中 则 是 一 个 指向 整 型 数 的 指针 。(FreeBSD 8.0 和 Linux 
3.2.0 不 支持 这 一 命令 。) 

当 PTY 主 设备 将 PTY 从 设备 设置 成 这 种 模式 时 , 它 通知 PTY 从 设备 上 的 行规 程 模块 对 从 主 
设备 接收 到 的 任何 数据 都 不 进行 任何 处 理 ， 不 管 从 设备 termios 结构 中 的 规范 或 非 规范 标志 是 
否 设置 ， 都 是 这 样 。 远 程 模式 适用 于 窗口 管理 器 这 种 进行 自己 的 行 编辑 的 应 用 程序 。 

3. 窗口 大 小 变化 

PTY 主 设 备 上 的 进程 可 以 用 TIOCSWINSZ ioctl 命令 来 设置 从 设备 的 窗口 大 小 。 如 果 新 的 
大 小 和 当前 的 大 小 不 同 ，SIGWINCH 信和 号 将 被 发 送 到 PTY 从 设备 的 前 台 进 程 组 。 

4. 信号 发 生 

读 、 写 PTY 主 设备 的 进程 可 以 向 PTY 从 设备 的 进程 组 发 送信 号 。 在 Solaris 10 中 ， 可 以 用 
TIOCSIGNAL ioctl 命令 做 到 这 一 点 。 在 FreeBSD 8.0、Linux 3.2.0 和 Mac OS X 10.6.8 中 ， 用 
TIOCSIG ioctl 来 做 到 这 一 点 。 在 这 两 种 情况 下 ， 第 三 个 参数 都 是 信号 编号 值 。 


19.8 小 结 


本 章 开 始 部 分 简要 叙述 了 如 何 使 用 伪 终 端 ， 并 观察 了 某 些 应 用 实例 。 接 着 ， 分 析 说 明了 在 本 书 
讨论 的 4 种 平台 上 打开 伪 终端 所 需 的 代码 。 然 后 用 此 代码 提供 了 通用 pty_fork 函数 ， 它 可 用 于 多 
种 不 同 的 应 用 。 该 函数 是 小 程序 (pty) 的 基础 ， 我 们 使 用 这 一 程序 揭示 了 伪 终 端的 许多 属性 。 

伪 终 端 在 大 多 数 UNIX 系统 中 每 天 都 被 用 来 进行 网 络 登录 。 我 们 还 检查 了 伪 终 端的 许多 其 他 
用 途 ， 从 script 程序 到 使 用 批 处 理 脚本 来 驱动 交互 式 程序 等 。 


习题 


19.1 当 用 telnet 或 rlogin 远程 登录 到 一 个 BSD 系统 上 时 ， 像 我 们 在 19.3 节 讨 论 过 的 那样 ， 
PTY 从 设备 的 所 有 权 和 权限 被 设置 。 该 过 程 是 如 何 发 生 的 ? 

19.2 使 用 pty 程序 来 确定 你 的 系统 用 于 初始 化 PTY 从 设备 的 termios 结构 和 winsize 结构 
的 值 。 

19.3 重 写 loop 函数 〈 见 图 19-12)， 使 之 成 为 使 用 select 或 poll 的 单个 进程 。 

194 在 子 进程 中 ,pty_fork 返回 后 ， 标 准 输入 、 标 准 输出 和 标准 错误 都 以 读 写 模 式 打 开 。 能 够 
将 标准 输入 变 成 只 读 ， 另 两 个 变 成 只 写 吗 ? 

19.5 在 图 19-13 中 ， 指 出 哪些 进程 组 是 前 台 的 ， 哪 些 进程 组 是 后 台 的 ， 并 指出 会 话 首 进程 。 

19.6 在 图 19-13 中 ， 当 键入 文件 终止 符 时 ， 进 程 终止 的 顺序 是 什么 ? 如 果 可 能 的 话 ， 用 进程 会 计 
信息 验证 之 。 

19.7 script(l) 程 序 通常 在 输出 文件 头 增加 一 行 说 明 它 的 开始 时 间 , 在 输出 文件 末尾 增加 一 行 说 
明 它 的 结束 时 间 。 将 这 些 特性 添加 到 本 章 展示 的 简单 的 shell 脚本 中 。 

19.8 解释 为 什么 在 下 面 的 例子 中 ， 即 使 程序 ttyname (A 18-16) 只 产生 输出 而 不 读 入 的 情 
OP, sc data 的 内 容 还 被 输出 到 终端 上 。 
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19.9 


$ cat data 一 个 两 行 的 文件 

hello, 

world 

$ pty -i « data ttyname -i -i RAR stdin 的 文件 结束 标志 
hello, 这 两 行 来 自 何 处 ? 

world 

fd 0:/dev/ttys005 我 们 期 望 ttyname 输出 这 3 fT 


fd 1:/dev/ttys005 
fd 2:/dev/ttys005 


编写 一 个 调用 pty fork 的 程序 ， 该 程序 有 一 个 子 进程 ， 该 子 进程 exec 另 一 个 你 写 的 程 
序 。 子 进程 exec 的 新 程序 能 够 捕获 SIGTERM 和 SIGWINCH。 当 捕获 到 信号 时 ， 要 打印 出 
有 关 消 息 ， 并 且 对 于 后 一 种 信号 ， 还 要 打印 终端 窗口 大 小 。 然 后 让 父 进程 用 19.7 节 描 述 过 
的 ioctl 命令 向 PTY 从 设备 的 进程 组 发 送 SIGTERM 信号 。 从 PTY 从 设备 读 回 消息 并 验 
证 捕获 到 了 该 信号 。 接 下 来 由 父 进程 设置 PTY 从 设备 窗口 的 大 小 ， 并 再 读 回 PTY 从 设备 的 
输出 。 让 父 进程 退出 〈exit) 并 确定 PTY 从 设备 进程 是 否 也 要 终止 ， 如果 要 终止 ， 应 如 何 
终止 ? 
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20.4 引言 


20 世纪 80 年 代 早期 ，UNIX 系统 被 认为 不 适合 运行 多 用 户 数据 库 系 统 IL Stonebraker[1981] 
和 Weinberger[1982])。 早 期 的 系统 Cin V7?7， 因 为 没有 提供 任何 形式 的 IPC 机 制 (除了 半 双 工 管 
道 )， 也 没有 提供 任何 形式 的 字 节 范 围 锁 机 制 ， 所 以 确实 不 适合 运行 多 用 户 数据 库 系 统 。 但 是 ， 
这 些 缺 陷 中 的 大 多 数 都 已 得 到 纠正 。 到 20 世纪 了 80 年 代 后 期 ，UNIX 系统 已 为 运行 可 靠 的、 多 
用 户 的 数据 库 系 统 提供 了 一 个 适合 的 环境 。 自 那 时 以 来 ， 很 多 商业 公司 都 已 提供 这 种 数据 库 系 统 。 

本 章 将 开发 一 个 简单 的 、 多 用 户 数据 库 的 C 函数 库 。 调 用 此 函数 库 提供 的 C 语言 函数 ， 其 他 
程序 可 以 获取 和 存储 数据 库 中 的 记录 。( 这 类 数据 库 通常 被 称 为 键 - 值 存储 。) 这 个 C 函数 库 只 是 
一 个 完整 的 数据 库 系 统 的 一 部 分 ， 我 们 并 不 开发 其 他 部 分 〈 如 查询 语言 等 )， 关 于 其 他 部 分 可 以 
参阅 专门 介绍 数据 库 的 教科 书 。 我 们 感 兴趣 的 是 数据 库 函数 库 与 UNIX 的 接口 ， 以 及 这 些 接口 与 
前 面 各 章节 所 涉及 主题 的 关系 (如 14.3 节 的 字 节 范围 锁 )。 


20.2 历史 


dbm(3) 是 一 个 在 UNIX 系统 中 很 流行 的 数据 库 函 数 库 ， 它 由 Ken Thompson 开发 ， 使 用 了 动 
态 散 列 结构 。 最 初 ， 它 与 V7 一 起 提供 ， 并 出 现在 所 有 BSD 版 本 中 ， 也 包含 在 SVR4 的 BSD 3E 
容 函 数 库 中 [AT&T 1990c]. BSD 的 开发 者 扩充 了 dbm 函数 库 ， 并 将 它 称 为 ndbm。ndbm 函数 库 
包括 在 BSD 和 SVR4 tH. ndbm MAE Single UNIX Specification 的 XSI 扩展 标准 的 一 部 分 。 
Seltzer 和 Yigit[1991] 中 详细 介绍 了 dbm 函数 库 使 用 的 动态 散 列 算法 的 历史 ,以 及 这 个 库 的 其 
他 实现 方法 ， 如 dbm 函数 库 的 GNU 版 本 gdbm。 但 是 ， 这 些 实现 的 一 个 根本 限制 是 它们 都 不 支 
持 多 个 进程 对 数据 库 的 并 发 更 新 。 它 们 都 没有 提供 并 发 控制 〈 如 记录 锁 机 制 )。 
4.4BSD 提供 了 一 个 新 的 库 一 一 db(3)， 该 库 支持 3 种 不 同 的 访问 模式 : 面向 记录 、 散 列 和 B 
树 。 同 样 ，db 也 没有 提供 并 发 控制 (这 一 点 在 db(3) 手 册页 的 BUGS 部 分 说 得 很 清楚 )。 
| Oracle (http://www.oracle.com) 提供 了 几 个 版 本 的 db 函数 库 ， 它 们 支持 并 发 访问 、 
| 锁 机 制 和 事务 。 
大 部 分 商用 数据 库 函 数 库 提 供 多 进程 同时 更 新 数据 库 所 需要 的 并 发 控制 。 这 些 系统 一 般 都 使 
用 14.3 节 中 介绍 的 建议 记录 锁 机 制 ， 但 是 ， 它 们 也 常常 实现 自己 的 锁 原 语 ， 以 避免 为 获得 一 把 无 
竞争 锁 而 需 的 系统 调用 开销 。 这 些 商 用 系统 通常 用 B+ 树 [Comer 1979] 或 某 种 动态 散 列 技术 ， 如 线 


604 第 20 章 数据 库 函数 库 


性 散 列 [Litwin 1980] 或 者 可 扩展 的 散 列 [Fagin et al. 1979] 来 实现 数据 库 。 
20-1 列 出 了 本 书 说 明 的 4 种 操作 系统 常用 的 数据 库 函 数 库 。 注 意 在 Linux E, gdbm 库 既 
支持 dbm 函数 库 ， 又 支持 ndbm BAE. 


| mae | POSK FreeBSD 8.0 Linux 3.2.0 Mac OS X 10.6.8 Solaris 10 





dbm gdbm ° 
ndbm XSI . gdbm . . 
db . . e 


20-1 多 种 平台 支持 的 数据 库 函 数 库 


20.3 FARE 


本 章 开发 的 函数 库 类 似 于 ndbm 函数 库 ， 但 增加 了 并 发 控制 机 制 ， 从 而 允许 多 进程 同时 更 新 
同一 数据 库 。 本 节 将 首先 描述 数据 库 函数 库 的 C 语言 接口 ， 下 一 节 再 讨论 其 实现 。 
当 打开 一 个 数据 库 时 ， 通 过 返回 值得 到 一 个 代表 数据 库 的 句柄 〈 一 个 不 透明 指针 )。 将 用 此 
句柄 作为 参数 来 调用 其 他 数据 库 函数 。 


#include "apue_db .hn 


DBHANDLE db open(const char *pathname, int oflag, ... /* int mode */); 


返回 值 : FRH, BARGER, 若 失 败 ， 返回 NULL 





void db close(DBHANDLE db); 


如 果 db open 成 功 返 回 ， 则 将 建立 两 个 文件 ，patjnrarze.iat 和 pathname.dat, pathname.idx 
是 索引 文件 ，pathname.dat 是 数据 文件 。 参 数 oflag 作为 传递 给 open 〈 见 3.3 节 ) 的 第 二 个 参数 ， 
来 指定 这 些 文件 的 打开 模式 (只 读 、 读 / 写 或 如 果 文 件 不 存在 则 创建 等 )。 如 果 需 要 建立 新 的 数据 
FE, mode 将 作为 第 三 个 参数 传递 给 open 文件 访 问 权限 )。 

当 不 再 使 用 数据 库 时 ， 调 用 db close 来 关闭 数据 库 。db_close 将 关闭 索引 文件 和 数据 文 
件 ， 并 释放 数据 库 使 用 过 程 中 分 乱 到 的 所 有 用 于 内 部 缓冲 区 的 存储 空间 。 

当 向 数据 库 中 存 入 一 条 新 的 记录 时 ， 必 须 提 供 一 个 此 记录 的 键 ， 以 及 与 此 键 相 关联 的 数据 。 如 
果 此 数据 库存 储 的 是 人 事 信 息 ， 键 可 以 是 员工 D, 数据 可 以 是 此 员工 的 姓名 、 地 址 、 电 话 号 码 以 及 
受聘 日 期 等 。 实现 要 求 每 条 记录 的 键 必 须 是 唯一 的 (例如 , 不 会 有 两 个 员工 记录 有 同样 的 员工 ID )。 


#include "apue db.h" 


int db store(DBHANDLE db, const char *key, const char *data, int flag); 
返回 值 : 若 成 功 ， 返 回 0;， Fite. IRIE OMA CAPD 





key 和 data 是 申 null 字符 终止 的 字符 串 。 它 们 可 以 包含 除了 null 字符 外 的 任何 字符 ， 如 换行 符 。 

flag 参数 只 能 是 DB INSERT (插入 一 条 新 记录 )、DB_REPLACE (替换 一 条 已 有 的 记录 ) 或 
DB STORE (插入 一 条 新 记录 或 替换 一 条 已 有 的 记录 ， 只 要 合适 无 论 哪 一 种 都 可 以 )。 这 3 个 常数 
定义 在 apue db.h 头 文件 中 。 如 果 使 用 DB_INSERT 或 DB_STORE， 并 且 记 录 并 不 存在 ， 则 插 
入 一 条 新 记录 。 如 果 使 用 DB_REPLACE 或 DB STORE, 并且 该 记录 已 经 存在 ， 则 用 新 记录 兰 换 已 
有 记录 。 如 果 使 用 DB_REPLACE， 而 记录 不 存在 ， 则 将 errno 设置 为 ENOENT， 返 回 值 为 1， 并 
且 不 加 入 新 记录 。 如 果 使 用 DB_INSERT， 而 记录 已 经 存在 ， 则 不 插入 新 记录 ， 返 回 值 为 1. TEX 
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里 ， 返 回 1 以 区 别 于 一 般 的 出 错 返回 《一 1)。 
通过 指定 键 key 可 以 从 数据 库 中 获取 一 条 记录 。 


#include "apue db.h" 


char *db fetch(DBHANDLE db, const char *key); 
返回 值 ， 车 成 功 ， 返 回 指向 数据 的 指针 ; 若 没 有 找到 记录 ， 返 回 NULL 
如 果 找 到 了 记录 ,返回 指向 通过 key 存放 的 数据 的 指针 。 通过 指定 key, 也 可 以 在 数据 库 中 删 
除 一 条 记录 。 (745. 


#include "apue_db.h" 





int db_delete(DBHANDLE db, const char *key); 





除了 通过 指定 key 获取 记录 外 , 还 可 以 逐条 记录 地 访问 数据 库 。 为 此 ， 首 先 调用 db_rewind 
回 滚 到 数据 库 的 第 一 条 记录 ， 然 后 在 每 一 次 循环 中 调用 db_nextrec， 上 顺序 地 读 每 条 记录 。 
#include "apue db.h" 
void db rewind(DBHANDLE db); 


char *db nextrec(DBHANDLE db, char *key): 
返回 值 ， 若 成 功 ， 返 回 指向 数据 的 指针 ;车 到 达 数 据 库 文件 的 尾 端 ， 返 回 NULL 





如 果 key 是 非 空 指针 ，dib_nextrec 将 这 个 指针 复制 到 存储 区 域 开 始 的 内 存 位 置 ， 然 后 返回 
这 个 指针 。 

db nextrec 不 保证 其 返回 记录 的 顺序 ， 只 保证 对 数据 库 中 的 每 一 条 记录 只 读 取 一 次 。 如 果 
顺序 存储 3 条 键 分 别 为 A、B、C 的 记录 ， 则 无 法 确定 do nextrec 将 按 什 么 顺序 返回 这 3 Rid 
录 。 它 可 能 按 B、A、C 的 顺序 返回 ， 也 可 能 按 其 他 顺序 。 实 际 的 顺序 由 数据 库 的 实现 决定 。 

这 7 个 函数 提供 了 数据 库 函 数 库 的 接口 。 接 下 来 介绍 实现 。 


20.4 ”实现 概述 


访问 数据 库 的 函数 库 通 常 使 用 两 个 文件 来 存储 信息 : 一 个 索引 文件 和 一 个 数据 文件 。 索 引文 
件 包括 实际 的 索引 值 〈 键 》 和 一 个 指向 数据 文件 中 对 应 数据 记录 的 指针 。 有 许多 技术 可 用 来 组 织 
索引 文件 以 提高 按键 查询 的 速度 和 效率 ， 散 列表 和 B+ 树 是 两 种 常用 的 技术 。 我 们 采用 固定 大 小 
的 散 列表 来 组 织 索引 文件 结构 ， 并 采用 链表 法 解决 散 列 冲突 。 在 介绍 db open 时 ， 曾 提 到 将 创 
建 两 个 文件 ， 一 个 以 .idx 为 后 缀 的 索引 文件 和 一 个 以 .dat 为 后 缀 的 数据 文件 。 

我 们 将 键 和 索引 以 null 结尾 的 字符 串 形式 存储 ， 它 们 不 能 包含 任意 的 二 进 制 数据 。 有 些 数 据 库 系 统 
用 二 进 制 形式 存储 数值 数据 (如 用 1 个 、2 个 或 4 个 字 节 存储 一 个 整数 ) 以 节省 存储 空间 ， 这 样 一 来 使 
函数 复杂 化 ， 也 使 数据 库 文件 在 不 同 的 平台 间 移 植 比较 困难 。 例 如 ， 网 络 上 有 两 个 系统 使 用 不 同 的 二 进 
制 格式 存储 整数 ， 如 果 想 要 这 两 个 系统 都 能 够 访问 数据 库 ， 就 必须 解决 不 同 存储 格式 的 问题 〈 今 天 个 同 
体系 结构 的 系统 在 网 络 上 共享 文件 已 经 很 常见 了 )。 按 照 字符 串 形式 存储 所 有 的 记录 ,包括 键 和 数据 ， 能 
使 这 一 切 变 得 简单 。 这 确实 需要 使 用 更 多 的 磁盘 空间 ， 但 降低 了 获得 可 移植 性 需要 付出 的 代价 。 746 

db store 要 求 对 于 每 个 键 ， 只 有 一 条 对 应 的 记录 。 有 些 数据 库 系 统 允 许多 条 记录 使 用 同样 
的 键 ， 并 提供 方法 访问 与 一 个 键 相 关 的 所 有 记录 。 另 外 ， 我 们 只 有 一 个 索引 文件 ， 这 意味 着 每 个 
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数据 记录 只 能 有 一 个 键 〈 我 们 不 支持 次 键 )。 有 些 数据 库 人 允许 一 条 记录 拥有 多 个 键 ， 并 且 对 每 一 
个 键 使 用 一 个 索引 文件 。 当 揪 入 或 删除 一 条 记录 时 ， 要 对 所 有 的 索引 文件 进行 相应 的 修改 。( 一 
个 拥有 多 个 索引 的 例子 是 员工 库 文 件 。 可 以 将 员工 ID 作为 键 ， 也 可 以 将 员工 的 社会 保险 号 作为 
键 。 由 于 员工 的 名 字 并 不 保证 唯一 ， 所 以 名 字 不 能 作为 键 。) 






20-2 是 数据 库 实 现 的 基本 结构 。 

空闲 链表 中 第 一 条 

索引 记录 的 偏 移 量 
p E 

空闲 
链表 | 链表 链表 

wo r 
- r $ | 
a 1 
该 散 列 链表 中 第 一 条 ver | 
索引 记录 的 偏 移 量 TU 0-7 | 
e l 
pu | 一 条 索引 记录 | | 
一 l 
zi | 


该 散 列 链 表 中 下 一 条 
索引 记录 的 偏 移 量 





数据 文件 : 


| 数据 记录 长 度 | 


图 20-2 索引 文件 和 数据 文件 结构 


索引 文件 由 3 部 分 组 成 : 空闲 链表 指针 、 散 列表 和 索引 记录 。 图 20-2 中 ， 所 有 指针 字段 中 实 
际 存储 的 是 ASCH 码 数字 形式 的 文件 偏 移 量 。 

当 给 定 一 个 键 ， 要 在 数据 库 中 寻找 一 条 记录 时 ，db_fetch 根据 该 键 计算 散 列 值 ， 由 此 散 列 
值 可 确定 一 条 散 列 链 〈 链 表 指 针 字 段 可 以 为 0， 表示 一 条 空 的 散 列 链 )。 治 着 这 条 散 列 链 ， 可 以 找 
到 所 有 具有 这 一 散 列 值 的 索引 记录 。 当 过 到 一 个 索引 记录 的 链表 指针 字段 为 0 时， 表示 到 达 了 此 
散 列 链 的 末尾 。 

下 面 来 看 一 个 实际 的 数据 库 文件 。 图 20-3 所 示 的 程序 建立 了 一 个 新 的 数据 库 ， 并 且 写 入 了 3 
条 记录 。 由 于 所 有 的 字段 都 以 ASCII 字符 的 形式 存储 在 数据 库 中 ， 所 以 可 以 用 任何 标准 的 UNIX 
系统 工具 来 查看 索引 文件 和 数据 文件 : 


$ ls -1 db4.* 
-rw-r--r-- à sar 28 Oct 19 21:33 db4.dat 
-rw-r--r-- 1 sar 72 Oct 19 21:33 db4.idx 
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$ cat db4.idx 
0 53 35 0 
0 10Alpha:0:6 
0 10beta:6:14 
17 1ll1gamma:20:8 
$ cat db4.dat 
datal 
Data for beta 
record3 


为 了 使 这 个 例子 紧凑 ， 将 每 个 指针 字段 的 大 小 设置 为 4 个 ASCII 字符 ， 将 散 列 链 的 数量 设置 为 3 
条 。 由 于 每 一 个 指针 中 记录 的 是 一 个 文件 偏 移 量 ， 所 以 4 个 ASCH 字符 限制 了 一 个 索引 文件 或 数 
据 文 件 的 大 小 最 多 只 能 为 10000 字 节 。 当 在 20.9 节 做 性 能 测试 时 , 将 指针 字段 的 大 小 设 为 6 个 字 
符 ( 这 样 文件 大 小 可 以 达到 1000000 字 节 )， 将 散 列 链 数量 设 为 100。 


#include "apue.h" 
#include "apue db.h" 
#include «fcntl.h» 


int 
main(void) 
{ 
DBHANDLE db; 


if ((db = db open("db4", O RDWR | O CREAT | O TRUNC, 
FILE MODE)) == NULL) 
err sys("db open error"); 


if (db store(db, "Alpha", "datal", DB INSERT) !- 0) 
err quit("db store error for alpha"); 

if (db store(db, "beta", "Data for beta", DB INSERT) !- Q0) 
err quit("db store error for beta"); 

if (db store(db, "gamma", "record3", DB INSERT) != 0) 


err quit("db store error for gamma"); 


db close (db); 
exit (0); 


图 20-3 ”建立 一 个 数据 库 并 写 入 3 条 记录 

索引 文件 的 第 一 行为 : 

0 53 35 0 
分 别 为 空闲 链表 指针 〈0 表示 空闲 链表 为 空 ) 和 3 个 散 列 链 的 指针 : 53. 35810. F—FT: 

0 10Alpha:0:6 
显示 了 一 条 索引 记录 的 结构 。 第 一 个 4 字符 字段 CO 为 链表 指针 ， 表 示 这 一 条 记录 是 此 散 列 链 的 
最 后 一 条 。 下 一 个 4 字符 字段 (10) Jidxlen (索引 记录 长 度 )， 表 示 此 索引 记录 剩余 部 分 的 长 度 。 
用 两 个 read 操作 来 读 取 一 条 索引 记录 : 第 一 个 read 读 取 这 两 个 固定 长 度 的 字段 (链表 指针 和 索 
引 记录 长 度 )， 然 后 再 根据 索引 记录 长 度 来 读 取 后 面 的 不 定 长 部 分 。 剩 下 的 3 个 字段 为 键 、 数 据 记 
录 的 偏 移 量 和 数据 记录 的 长 度 。 这 3 个 字段 用 分 隔 符 隔 开 ， 此 处 使 用 的 分 隔 符 是 冒号 。 由 于 这 3 
个 字段 都 是 不 定 长 的 ， 所 以 需要 一 个 专门 的 分 隔 符 ， 而 且 这 个 分 跑 符 不 能 出 现在 键 中 。 最 后 用 一 个 
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\n (FAITH) 结束 这 一 条 索引 记录 。 由 于 在 索引 记录 长 度 字 段 中 已 经 有 了 记录 的 长 度 ， 所 以 这 个 
换行 符 并 不 是 必需 的 ， 加 上 换行 符 是 为 了 把 各 条 索引 记录 分 开 ， 这 样 就 可 以 用 标准 的 UNIX RAL 
有 具 《 如 cat 和 more) 来 查看 索引 文件 。 键 字段 是 将 记录 写 入 数据 库 时 指定 的 值 。 数 据 记 录 在 数据 
文件 中 的 偏 移 量 为 0， 长 度 为 6。 从 数据 文件 中 可 看 到 数据 记录 确实 从 0 开始 ， 长 度 为 6 个 字 节 。 (与 
索引 文件 一 样 ， 这 里 自动 在 每 条 数据 记录 的 后 面 追加 一 个 换行 符 ， 以 便于 使 用 UNIX 系统 工具 。 在 
调用 ab_fetch 时 ， 此 换行 符 不 作为 数据 返回 。) 

如 果 在 这 个 例子 中 跟踪 3 条 散 列 链 ， 可 以 看 到 第 一 条 散 列 链 上 第 一 条 记录 的 偏 移 量 是 53 
(gamma)。 这 条 链 上 下 一 条 记录 的 偏 移 量 为 17 (alpha)， 并 且 是 这 条 链 上 的 最 后 一 条 记录 。 
第 二 条 散 列 链 上 的 第 一 条 记录 的 偏 移 量 是 35 (beta)， 且 是 此 链 上 最 后 一 条 记录 。 第 三 条 散 列 
BS. 

请 注意 ， 索 引文 件 中 键 的 顺序 和 数据 文件 中 对 应 数据 记录 的 顺序 与 图 20-3 程序 中 调用 db_ 
store 的 顺序 一 样 。 由 于 在 调用 db open 时 使 用 了 O_TRUNC 标志 , 索引 文件 和 数据 文件 都 被 截 
断 了 ， 整 个 数据 库 相 当 于 重新 初始 化 。 在 这 种 情况 下 ，db_store 将 新 的 索引 记录 和 数据 记录 追 
加 到 对 应 的 文件 末尾 。 后 面 将 看 到 ，db_store 还 可 以 重复 使 用 这 两 个 文件 中 已 删 除 记录 原来 对 
应 的 空间 。 

使 用 固定 大 小 的 散 列 表 作 为 索引 是 一 个 妥协 。 当 每 个 散 列 链 都 不 太 长 时 ， 这 个 方法 能 保证 快 

748| 速 地 访问 。 我 们 的 目的 是 能 够 快速 地 查找 任 一 键 ， 同 时 又 不 使 用 太 复 杂 的 数据 结构 (如 B 树 或 动 
749| 态 散 列表 )。 动 态 散 列表 的 优点 是 能 保证 仅 用 两 次 磁盘 存 取 就 能 找到 数据 记录 〔 详 见 Litwin[1980] 

或 Fagin 等 [1979])。B 树 能 够 用 (已 排序 的 ) 键 的 顺序 来 遍历 数据 库 (采用 散 列表 的 db_nextrec 
函数 就 做 不 到 这 一 点 )。 


20.5 ”集中 式 或 非 集中 式 


当 有 多 个 进程 访问 同一 数据 库 时 ， 有 两 种 方法 可 实现 库 函数 。 

C1) 集中 式 。 由 一 个 进程 作为 数据 库 管 理 者 ， 所 有 的 数据 库 访 问 工作 由 此 进程 完成 。 其 他 进 
程 通 过 IPC 机 制 与 此 中 心 进程 进行 联系 。 

(2) 非 集 中 式 。 每 个 库 函 数 使 用 要 求 的 并 发 控制 〈 加 锁 )， 然 后 发 起 自己 的 VO 函数 调用 。 

使 用 这 两 种 技术 的 数据 库 系统 都 有 。 如 果 有 适当 的 加 锁 例 程 ， 因 为 避免 了 使 用 IPC， 那 么 非 

集中 式 方法 一 般 要 快 一 些 。 图 20-4 描绘 了 集中 式 方法 的 操作 。 

中 特意 表示 出 IPC 像 绝 大 多 数 UNIX 系统 的 消息 传递 一 样 需要 经 过 操作 系统 内 核 (15.9 节 
中 说 明 的 共享 存储 不 需要 这 种 经 过 内 核 的 复制 )。 在 集中 方式 下 ， 中 心 控制 进程 将 记录 读 出 ， 然 
后 通过 IPC 机 制 将 数据 传递 给 请 求 进程 。 这 是 这 种 设计 的 不 足 之 处 。 注 意 ， 集 中 式 数 据 库 管理 进 
程 是 唯一 对 数据 库 文件 进行 VO 操作 的 进程 。 

集中 式 的 优点 是 能 够 根据 需要 来 对 操作 模式 进行 调整 。 例 如 ， 可 以 通过 中 心 进程 给 不 同 的 进 
程 赋予 不 同 的 优先 级 ， 这 会 影响 到 中 心 进程 对 LO 操作 的 调度 。 而 用 非 集中 式 方法 则 很 难 做 到 这 
一 点 。 在 这 种 情况 下 ， 只 能 依赖 于 操作 系统 内 核 的 磁盘 UO 调度 策 路 和 加 锁 策 略 (例如 ， 当 3 个 
进程 同时 等 待 一 个 即将 可 用 的 锁 时 ， 我 们 无 法 确定 哪个 进程 将 得 到 这 个 锁 )。 

集中 式 方法 的 另 一 个 优点 是 ， 恢 复 要 上 比 非 集中 式 方法 容易 。 在 集中 式 方法 中 ， 所 有 状态 信息 
都 集中 存放 在 一 处 ， 所 以 如 车 杀 死 了 数据 库 进 程 ， 只 需 在 该 处 查看 以 识别 出 需要 解决 的 未 完成 事 
务 ， 然 后 将 数据 库 恢 复 到 一 致 状态 。 
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用 户 进程 用 户 进程 用 户 进程 


数据 库 访 
fe) CHE 





20-4 ”集中 式 数据 库 访 问 


20-5 描绘 了 非 集中 式 方 法 ， 本 章 的 实现 就 是 采用 这 种 方法 。 
用 户 进程 用 户 进程 





20-5 ” 非 集中 式 数据 库 访 问 | 751 
调用 数据 库 库 函 数 执行 VO 的 用 户 进程 是 合作 进程 , 它们 使 用 字 节 范围 记录 锁 机 制 来 实现 并 发 控制 。 
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20.6 并 发 


由 于 很 多 系统 的 实现 都 采用 两 个 文件 〈 一 个 索引 文件 和 一 个 数据 文件 ) 的 方法 ， 所 以 在 此 也 
使 用 这 种 方法 ， 这 要 求 能 够 控制 对 两 个 文件 的 加 锁 。 有 很 多 方法 可 用 来 对 两 个 文件 进行 加 锁 。 

1. BRE 

最 简单 的 加 锁 方 法 是 将 这 两 个 文件 中 的 一 个 作为 整个 数据 库 的 锁 ， 并 要 求 调用 者 在 对 数据 库 
进行 操作 前 必须 获得 这 个 锁 。 这 种 加 锁 方式 称 为 粗 粒 度 锁 (coarse-grained locking)。 例 如 ， 可 以 
认为 一 个 进程 对 索引 文件 的 0 字 节 加 了 读 锁 后 ， 才 能 读 整 个 数据 库 ， 一 个 进程 对 索引 文件 的 0 F 
节 加 了 写 锁 后 ， 就 能 写 整个 数据 库 。 可 以 使 用 UNIX 系统 的 字 节 范围 锁 机 制 来 控制 每 次 可 以 有 多 
个 读 进 程 ， 而 只 能 有 一 个 写 进程 ( 见 图 14-3)。db_fetch 和 db_nextrec 函数 要 求 具有 读 锁 ， 
而 db_delete、db_store 和 db_open 则 要 求 具有 写 锁 。(Gb_open 要 求 写 锁 的 原因 是 如 果 要 
创建 新 文件 的 话 ， 要 在 索引 文件 前 端 建立 空闲 区 链表 以 及 散 列 链表 .) 

粗 粒度 锁 的 问题 是 它 限制 了 并 发 。 用 粗 粒度 锁 时 ， 当 一 个 进程 向 一 条 散 列 链 中 添加 一 条 记录 
时 ， 其 他 进程 无 法 访问 另 一 条 散 列 链 上 的 记录 。 

2. 细 粒 度 锁 

细 粒 度 锁 (fine-grained locking) 的 方法 改进 了 粗 粒 度 锁 ， 提 供 了 更 高 的 并 发 性 。 一 个 读 进程 
或 写 进程 在 操作 一 条 记录 前 必须 先 获得 此 记录 所 在 散 列 链 的 读 锁 或 写 锁 。 一 条 散 列 链 允 许 同 时 有 
多 个 读 进 程 ， 但 只 能 有 一 个 写 进程 。 其 次 ， 一 个 写 进程 在 访问 空闲 区 链表 CM db delete 或 
db store) 前 ， 必 须 获 得 空闲 区 链表 的 写 锁 。 最 后 ， 当 db_store 向 索引 文件 或 数据 文件 末尾 
追加 一 条 新 记录 时 ， 必 须 获 得 对 应 文件 相应 区 域 的 写 锁 。 

期 望 细 粒 度 锁 能 比 粗 粒 度 锁 能 提供 更 高 的 并 发 性 。20.9 节 将 给 出 一 些 实际 的 比较 测试 结 
果 。20.8 节 给 出 了 细 粒 度 锁 实现 的 源 代码 ， 并 讨论 锁 的 实现 细节 〔 粗 粒度 锁 是 这 个 细 粒 度 锁 实 
现 的 简化 )。 

在 源 代码 中 ， 直 接 调 用 了 read、readv、write 和 writev。 没 有 使 用 标准 VO HAE. 

虽然 使 用 标准 VO 函数 库 也 可 以 使 用 字 节 范围 锁 , 但 是 需要 非常 复杂 的 缓冲 管理 。 例如 ， 标 准 VO 

缓冲 区 的 数据 在 5 分 钟 之 前 被 另 一 个 进程 修改 了 ， 那 么 我 们 就 不 希望 fgets 返回 的 数据 是 10 分 
钟 之 前 读 入 标准 IO 缓冲 区 的 数据 。 

以 上 对 并 发 的 讨论 依据 的 是 对 数据 库 函 数 库 的 简单 希 求 。 商 业 系统 一 般 有 更 多 的 需要 。 关 于 
并 发 更 多 的 细节 可 以 参见 Data[2004] 的 第 16 章 。 


20.7 ”构造 函数 库 


数据 库 的 函数 库 由 两 个 文件 构成 , 一 个 公用 的 C 头 文件 以 及 一 个 C 源 文件 ,。 我 们 可 以 用 下 列 
命令 构造 一 个 静态 函数 库 。 


gcc -I../include -Wall -c db.c 
ar rsv libapue db.a db.o 


因为 我 们 在 数据 库 范 数 库 中 使 用 了 了 一 些 我 们 自己 的 公共 函数 ， 所 以 希望 与 libapue db.a 相连 接 
的 应 用 程序 也 需要 与 1ibapue .a 相连 接 。 
另 一 方面 ， 如 果 想 构建 数据 库 函数 库 的 动态 共享 库 版 本 ， 可 使 用 下 列 命令 : 
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gcc -I../include -Wall -fPIC -c db.c 
gcc -shared -Wl,-soname,libapue db.so.1 -o libapue db.so.1 \ 
-L../lib -lapue -lc db.o 


构建 成 的 共享 库 1ibapue db.so.1 需 放置 在 动态 连接 程序 / 载 入 程序 (dynamic linker/loader) 能 
够 找到 的 一 个 公用 目录 中 。 还 可 以 将 共享 库 放 置 在 一 个 私有 目录 中 ， 修 改 LD_LIBRARY_PATH 环境 
变量 ， 使 动态 连接 程序 / 载 入 程序 的 搜索 路 径 包 含 该 私有 目录 。 


| 在 不 同 平台 闻 ， 构 建 共享 库 的 步 又 会 有 所 不 同 。 这 里 说 明 的 步骤 是 在 带 GNU C 编译 器 的 Linux 
| 系统 中 进行 的 。 


20.8 WEB 


本 节 解 释 我 们 编写 的 数据 库 函 数 库 源 代码 ， 先 从 头 文件 apue db.h 开始 。 函数 库 源 代码 以 
及 调用 此 函数 库 的 所 有 应 用 程序 都 包含 这 一 头 文件 。 

从 此 处 开始 ， 实 例 程序 的 编排 方式 在 很 多 方面 与 前 面 的 实例 程序 编排 有 所 不 同 。 首 先 ， 因 为 
源 代码 较 长 ， 为 此 加 了 行 号 ， 这 使 得 通过 行 号 联系 相应 的 源 代码 进行 讨论 更 加 方便 。 其 次 ， 对 源 
代码 的 说 明 紧 随 相 关 源 代码 之 后 。 


| 这 种 风格 受到 John Lions 解释 UNIX V6 操作 系统 源 代码 的 书 [Lions 1977, 1996] 的 影响 ， 这 使 
| 得 解释 说 明 大 量 源 代码 更 为 简易 。 
注意 ， 此 处 对 空白 行 不 编号 。 虽 然 某 些 工 具 〈 如 pr(1)) 的 正常 操作 与 这 些 空白 行 是 有 关 的 ， 
但 是 我 们 对 它们 并 无 任何 兴趣 。 


1 #ifndef  APUE DB H 
2 #define APUE DB H 


3  typedef void * DBHANDLE; 


4  DBHANDLE db open(const char *, int, ...); 

5 void db close (DBHANDLE) ; 

6 char *db fetch (DBHANDLE, const char *); 

了 int db store(DBHANDLE, const char *, const char *, int); 
8 int db delete(DBHANDLE, const char *); 

9 void db rewind (DBHANDLE); 

10 char *db nextrec(DBHANDLE, char *); 

11 /* 

12 * Flags for db store(). 

13 */ 

14 #define DB INSERT 1 /* insert new record only */ 

15 #define DB REPLACE 2 /* replace existing record */ 

16 #define DB STORE 3 /* replace or insert */ 

17 /* 

18  * Implementation limits. 

19 */ 

20 #define IDXLEN MIN 6 /* key, sep, start, sep, length, Mn */ 


21 #define IDXLEN MAX 1024 /* arbitrary */ 
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22 #define DATLEN MIN 2 
23 #define DATLEN MAX 1024 


/* data byte, newline */ 
/* arbitrary */ 


24 #endif /* APUE DBH */ 


[1773] 


[4710] 


[1124] 


使 用 符号 _APUE_DB_H 以 保证 只 包括 该 头 文件 一 次 。 DBHANDLE 类 型 表示 对 数据 库 的 
一 个 有 效 引 用 ， 用 于 隔离 应 用 程序 和 数据 库 的 实现 细节 。 将 此 技术 与 标准 VO 库 向 应 
用 程序 提供 FILE 结构 相 比 较 ， 两 者 相似 。 

接着 ， 声 明了 数据 库 函 数 库 公 有 函数 的 原型 。 因 为 使 用 函数 库 的 应 用 程序 包括 了 此 头 
文件 ， 所 以 这 里 不 再 声明 函数 库 私 有 函数 的 原型 。 

定义 了 可 以 传送 给 db store 函数 的 合法 标志 。 其 后 是 实现 的 基本 限制 。 如 果 希 望 
支持 更 大 的 数据 库 ， 可 以 更 改 这 些 限制 。 

最 小 索引 记录 长 度 由 IDXLEN_MIN 指定 。 这 表示 1 字 节 键 、1 字 节 分 隔 符 、1 字 节 起 
始 偏 移 量 ， 另 一 个 1 字 节 分 隔 符 、1 字 节 长 度 和 终止 换行 符 。( 回 忆 图 20-2 中 索引 记 
录 的 格式 。) 一 条 索引 记录 通常 长 于 IDXLEN MIN 字 节 ， 这 只 是 最 小 长 度 。 


下 一 个 文件 是 db .c， 它 是 库 函 数 的 C 源 文件 。 为 简化 起 见 ， 将 所 有 函数 都 放 在 一 个 文件 中 。 
这 样 处 理 的 优点 是 只 要 将 私有 函数 声明 为 static， 就 可 对 外 将 它 隐 蔽 起 来 。 





1 #include "“apue.h" 

2 #include "apue db.h" 

3 #include «fcntl.h» /* open & db open flags */ 

4 #include <stdarg.h> 

5 #include <errno.h> 

6 #include «sys/uio.h»  /* struct iovec */ 

7 /* 

8 * Internal index file constants. 

9 * These are used to construct records in the 

10 * index file and data file. 

11 */ 

12 #define IDXLEN SZ 4 /* index record length (ASCII chars) */ 
13 #define SEP Vet /* separator char in index record */ 
14 #define SPACE 1 n /* space character */ 


15 #tdefine NEWLINE "An! /* newline character */ 
16 /* 
17 * The following definitions are for hash chains and free 


18 * Jist chain in the index file. 


19 ay 

20 #define PTR SZ 7 /* size of ptr field in hash chain */ 
21 #define PTR MAX 999999 /* max file offset - 10**PTR SZ - 1 */ 
22 #define NHASH DEF 137 /* default hash table size */ 

23 #define FREE OFF 0 /* free list offset in index file */ 
24 #define HASH OFF PTR SZ /* hash table offset in index file */ 


/* hash values */ 
/* unsigned counter */ 


25  typedef 
26  typedef 


[6] ”使 用 了 一 些 私有 函数 库 中 的 函数 ， 所 以 程序 中 包括 了 apue.h. SR, apue.h 也 包 
括 若 干 标 准 头 文件 ， 包 括 <stdio.h> 和 <unistad.h>。 因 为 db open 函数 使 用 由 
<stdarg.h> 定 义 的 可 变 参 数 函 数 ， 所 以 程序 中 也 包括 了 <stdarg.h>。 


unsigned long DBHASH; 
unsigned long COUNT; 
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[7—26] “索引 记录 的 长 度 说 明 为 IDXLEN_SzZ。 我 们 用 某 些 字符 《〈 如 冒号 、 换 行 符 ) 作为 数据 


库 中 的 分 隔 符 。 当 删除 一 记录 时 ， 在 其 中 全 部 填 入 空格 符 。 
其 中 一 些 定义 为 常量 的 值 也 可 定义 为 变量 ， 只 是 会 使 实现 复杂 一 些 。 例 如 ， 设 定 散 列 
表 的 大 小 为 137 记录 项 ， 也 许 更 好 的 方法 是 让 do open 的 调用 者 根据 预期 的 数据 库 


大 小 通过 参数 来 设 定 这 个 值 ， 然 后 将 该 值 存 在 索引 文件 的 最 前 面 。 755 
/* 
*Library's private representation of the database. 
*/ 
typedef struct { 
int idxfd; /* fa for index file */ 
int datfd; /* fd for data file */ 
char *idxbuf; /* malloc'ed buffer for index record */ 
char *datbuf; /* malloc'ed buffer for data record*/ 
char *name; /* name db was opened under */ 
off t idxoff; /* offset in index file of index record */ 
/* key is at (idxoff + PTR SZ + IDXLEN SZ) */ 
size t idxlen; /* length of index record */ 
/* excludes IDXLEN SZ bytes at front of record */ 
/* includes newline at end of index record */ 
off t datoff; /* offset in data file of data record */ 
Size t datlen; /* length of data record */ 
/* includes newline at end */ 
off t ptrval; /* contents of chain ptr in index record */ 
off t ptroff; /* chain ptr offset pointing to this idx record */ 
off t chainoff; /* offset of hash chain for this index record */ 
off t hashoff; /* offset in index file of hash table */ 
DBHASH nhash; /* current hash table size */ 
COUNT cnt delok; /* delete OK */ 
COUNT cnt delerr; /* delete error */ 
COUNT cnt fetchok; /* fetch OK */ 
COUNT cnt fetcherr; /* fetch error */ 
COUNT cnt nextrec; /* nextrec */ 
COUNT cnt storl; /* store: DB INSERT, no empty, appended */ 
COUNT cnt, stor2; /* store: DB INSERT, found empty, reused */ 
COUNT cnt stor3; /* store: DB REPLACE, diff len, appended */ 
COUNT cnt stor4; /* store: DB REPLACE, same len, overwrote */ 
COUNT cnt storerr; /* store error */ 
} DB; 





[27-48] ”在 DSB 结构 中 记录 一 个 打开 数据 库 的 所 有 信息 。db_cpen 函数 返回 DB 结构 的 指针 


DBHANDLE 值 。 这 个 指针 被 用 于 其 他 所 有 函数 ， 而 该 结构 本 身 则 不 面向 亩 用 者 。 
因为 在 数据 库 中 以 ASCI 形式 存放 指针 和 长 度 ， 所 以 将 这 些 转换 为 数字 值 ， 并 存放 
在 DB 结构 中 。 也 存放 散 列表 长 度 ， 虽 然 一 般 而 言 ， 这 是 定 长 的 ， 但 也 有 可 能 为 加 强 
该 函数 库 ， 人 允许 调用 者 在 创建 数据 库 时 指定 该 长 度 〈 见 习题 20.7)。 


[49—59] DB 结构 的 最 后 10 个 字段 对 成 功 和 不 成 功 的 操作 进行 计数 。 如 果 想 要 分 析 数 据 库 的 性 能 ， 


则 可 编写 一 个 函数 返回 这 些 统计 值 。 但 目前 我 们 仅 保 持 这 些 计数 器 ， 并 未 编写 此 种 函数 。 





60 
61 
62 
63 


/[* 

*Internal functions. 

*/ 

static DB * db alloc(int); 
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64 
65 
66 
67 
68 
69 
70 
71 
72 
73 
74 


75 
76 
77 
78 
79 
80 
81 
82 
83 
84 
85 
86 
87 


88 
89 
90 
91 
92 
93 





static void .db dodelete(DB *); 

Static int .db find and lock(DB *, const char *, int); 
static int .db findfree(DB *, int, int); 

Static void .db free(DB *); 

Static DBHASH _db hash(DB *, const char *); 

Static char  * db readdat(DB *); 

static off t db readidx(DB *, off t); 

Static off t db readptr(DB *, off t); 

Static void .db writedat(DB *, const char *, off t, int); 
static void .db writeidx(DB *, const char *, off t, int, off t); 
static void .db writeptr(DB *, off t, off t); 


/* 
*Open or create a database. Same arguments as open(2). 
wy 
DBHANDLE 
db open(const char *pathname, int oflag, ...) 
i 
DB *db; 
int len, mode; 
size t i; 
char asciiptr[PTR SZ + 1], 


hash[(NHASH DEF + 1) * PTR SZ + 2]; 
/* +2 for newline and null */ 
struct stat statbuff; 


/* 
* Allocate a DB structure, and the buffers it needs. 
Xy 
len = strlen{pathname} ; 
if (({db = db alloc(len)} == NULL) 
err dump("db open: _db_alloc error for DB"); 


[6074] ”选择 用 db_ 开 头 来 命名 用 户 可 调用 (公有) 的 所 有 函数 , 用 _db_ 开 头 来 命名 内 部 ( 私 


A) 函数 。 公 有 函数 在 函数 库 头 文件 apue_db .h 中 声明 。 内 部 函数 声明 为 static, 
所 以 只 有 同一 文件 中 的 其 他 函数 才能 调用 它们 (该 文件 包含 函数 库 实现 )。 


[75-93] db open 函数 的 参数 与 open(2) 相 同 。 如 果 调 用 者 想 要 创建 数据 库 文件 ， 那 么 用 可 选 


94 
95 
96 
97 


98 
99 


100 
101 
102 


103 
104 


择 的 第 三 个 参数 指定 文件 权限 。db_open 函数 打开 索引 文件 和 数据 文件 ， 在 必要 时 初 
始 化 索引 文件 。 该 函数 调用 _db_alloc 来 为 DB 结构 分 配 空间 ， 并 初始 化 此 结构 。 


db-»nhash  - NHASH DEF;/* hash table size */ 

db->hashoff = HASH OFF; /* offset in index file of hash table */ 
strcpy(db-»name, pathname); 

strcat(db-»name, ".idx"); 


if (oflag & O CREAT) { 
va list ap; 


va start(ap, oflag); 
mode = va arg(ap, int); 
va end (ap) ; 


/* 
* Open index file and data file. 
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105 xy 

106 db-»idxfd = open(db-»name, oflag, mode); 

107 strcpy(db-»name + len, ".dat"); 

108 db->datfd = open(db-»name, oflag, mode); 

109 ) else | 

110 £* 

111 * Open index file and data file. 

112 */ 

113 db->idxfd = open(db-»name, oflag); 

114 strcpy(db-»name + len, ".dat"); 

115 db->datfd = open(db->name, oflag); 

116 ] 

117 if (db-»idxfd < 0 || db-»datfd < 0) { 

118 .db free (db); 

119 return (NULL); 

120 ) 

[94—97] 继续 初始 化 DB 结构 。 调 用 者 传 入 的 路 径 名 指定 数据 库 文 件 名 的 前 级 。 妃 加 后 
Zi .idx 以 构成 数据 库 索 引文 件 的 名 字 。 

[098—108] ”如 果 调 用 者 想 要 创建 数据 库 文 件 ， 那 么 使 用 <stdarg .n> 中 的 可 变 参数 函数 以 找 
到 可 选 的 第 三 个 参数 。 然 后 ， 使 用 open 创建 并 打开 索引 文件 和 数据 文件 。 注 意 ， 
数据 文件 的 文件 名 以 索引 文件 同样 的 前 缀 开始 ， 但 后 缀 为 .dat。 

[109 一 116] ”如 果 调 用 者 没有 指定 O0 CREAT 标志 ， 那 么 正在 打开 已 有 的 数据 库 文 件 。 此 时 ， 只 
用 两 个 参数 调用 open。 

[117—120] ”如 果 在 打开 或 创建 任 一 数据 库 文件 时 出 错 ， 则 调用 _db_free 清除 DB 结构 ， 然 后 
对 调用 者 返回 NULL。 如 果 一 个 文件 open 成 功 而 另 一 个 失败 ，_db_free 将 关闭 
该 打开 文件 描述 符 。 我 们 很 快 就 会 见 到 这 一 操作 。 

121 if ((oflag & (O CREAT | O TRUNC)) == (O CREAT | O TRUNC)) { 

122 £t 

123 * If the database was created, we have to initialize 

124 * it. Write lock the entire file so that we can stat 

125 * it, check its size, and initialize it, atomically. 

126 */ 

127 if (writew lock(db-»idxfd, 0, SEEK SET, 0) < 0) 

128 err dump("db open: writew lock error"); 

129 if {fstat (db->idxfd, &statbuff) < 0) 

130 err sys("db open: fstat error"); 

131 if (statbuff.st size == 0) { 

132 /* 

133 * We have to build a list of (NHASH DEF + 1) chain 

134 * ptrs with a value of 0. The +1 is for the free 

135 * list pointer that precedes the hash table. 

136 */ 

137 sprintf(asciiptr, "$*d", PTR SZ, 0); 

[121—130] 如果 正 在 建立 数据 库 ， 则 必须 正确 地 加 锁 。 考 虑 两 个 进程 试图 同时 建立 同一 个 数 


据 库 的 情况 。 第 一 个 进程 运行 到 调用 fstat， 并 且 在 fstat 返回 后 被 内 核 阻 塞 。 
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这 时 第 二 个 进程 调用 db_open， 发 现 索 引文 件 的 长 度 为 0， 然 后 初始 化 空闲 链表 
和 散 列 链表 。 第 二 个 进程 继续 运行 ， 向 数据 库 中 写 入 了 一 条 记录 。 这 时 第 二 个 进 
程 被 阻塞 ， 第 一 个 进程 在 调用 fstat 后 立刻 继续 运行 ， 它 发 现 索 引文 件 的 长 度 为 
0《〔 因 为 第 一 个 进程 调用 fstat 在 前 ， 然 后 第 二 个 进程 再 初始 化 索引 文件 )， 所 以 
第 一 个 进程 重新 初始 化 空闲 链表 和 散 列 链表 , 第 二 个 进程 写 入 的 记录 就 被 抹 去 了 。 
避免 发 生 这 种 情况 的 方法 是 进行 加 锁 ， 为 此 可 以 使 用 14.3 节 中 的 readw_lock. 
writew_lock 和 un lock 这 3 个 宏 。 


[131—137] ”如 果 索 引文 件 的 长 度 是 0， 那 么 这 是 刚刚 被 创建 的 ， 所 以 需要 初始 化 它 所 包含 的 
空闲 列表 指针 和 散 列 链 指针 。 注 意 ， 使 用 格式 字符 串 sxd 将 数据 库 指针 从 整 型 转 
换 为 ASCI 字符 申 。( 在 db writeidx 和 _db_writeptr 中 还 将 使 用 这 种 格式 
FFB.) 这 一 格式 告诉 sprintf R PTR sz 参数 ， 用 它 作为 下 一 个 参数 的 最 小 
字段 宽度 ， 在 此 例 中 ， 它 是 0〈 此 处 ， 因 为 正在 创建 一 数据 库 ， 所 以 将 指针 初始 
化 为 0)。 其 作用 是 强迫 创建 的 字符 串 至 少 包含 PTR SZ 个 字符 《〈 在 左边 用 空格 充 
JA). YE db writeidx HI db writeptr 中 ， 将 传送 一 个 非 0 指针 值 ， 但 是 首 
先 将 验证 指针 值 不 大 于 PTR_MAX， 以 保证 写 入 数据 库 的 指针 字符 串 恰 好 为 
PTR_S2Z(7) 个 字符 。 

138 hash[0) = 0; 

139 for (i = 0; i < NHASH DEF + 1; i++) 

140 strcat (hash, asciiptr); 

141 strcat (hash, "\n"); 

142 i = strlen {hash}; 

143 if (write(db-»idxfd, hash, i) != i) 

144 err dump("db open: index file init write error"); 

145 } 

146 if (un_lock(db->idxfd, 0, SEEK_SET, 0) < 0) 

147 err dump("db open: un lock error"); 

148 ) 

149 db rewind (db); 

150 return (db); 

151 } 

152 /* 

153 * Allocate & initialize a DB structure and its buffers. 

154 */ 

155 static DB * 

156 db alloc(int namelen) 

157 { 

158 DB *db; 

159 /* 

160 * Use calloc, to initialize the structure to zero. 

161 二 

162 if ((db = calloc(l, sizeof(DB))) == NULL) 

163 err dump(" db alloc: calloc error for DB"); 

164 db-»idxfd = db->datfd = -1; /* descriptors */ 

165 /A* 


166 


* Allocate room for the name. 
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167 * 45 for ".idx" or ".dat" plus null at end. 

168 xy 

169 if ((db->name = malloc(namelen + 5)) == NULL) 

170 err dump(" db alloc: malloc error for name"); 

[138—151] ”继续 初始 化 新 创建 的 数据 库 。 构 造 散 列表 ， 将 它 写 到 索引 文件 中 。 然 后 ， 解 锁 索 
引文 件 , 重 置 数据 库 文件 指针 ,返回 DB 结构 指针 作为 句柄 ， 以 便 调用 者 以 后 用 于 
其 他 数据 库 函 数 。 

[152~164] | db open 调用 函数 _db_alloc 为 DB 结构 分 配 空间 , 包括 一 个 索引 缓冲 区 和 一 个 
数据 缓冲 区 。 用 calloc 分 配 存 储 区 来 存放 DB 结构 ， 并 将 该 存储 区 各 存储 单元 . 
全 部 初始 化 为 0。 这 产生 了 一 个 副作用 ， 也 就 是 将 数据 库 文件 描述 符 也 设置 为 0， 
为 此 需 将 它们 重新 设置 为 一 1， 表示 它们 至 此 还 不 是 有 效 的 。 

[165—170] 分配 空 间 以 存放 数据 库 索引 文件 和 数据 文件 的 名 字 。 如 db open 中 所 说 明 的 那 
样 ， 更 改 它们 的 名 字 后 缀 以 便 引 用 索引 文件 或 数据 文件 。 760 

171 /A* 

172 * Allocate an index buffer and a data buffer. 

173 * +2 for newline and null at end. 

174 +y 

175 if ((db-»idxbuf = malloc(IDXLEN MAX + 2)) == NULL) 

176 err dump(" db alloc: malloc error for index buffer"); 

177 if ({db->datbuf = malloc(DATLEN MAX + 2)) == NULL) 

178 err dump(" db alloc: malloc error for data buffer"); 

179 return (db) ; 

180 } 

181 /* 

182 * Relinquish access to the database. 

183  */ 

184 void 

185 db close(DBHANDLE h) 

186 ( 

187 .db free((DB *)h); /* closes fds, free buffers & struct */ 

188 } 

189  /* 


190 * Free up a DB structure, and all the malloc'ed buffers it 
191 * may point to. Also close the file descriptors if still open. 


192. */ 


193 static void 
194 db free(DB *db) 


195 { 

196 if (db-»idxfd >= 0) 

197 close(db-»idxfd); 

198 if (db->datfd >= 0) 

199 close (db->datfd) ; 

[171-180] ”为 索引 文件 和 数据 文件 的 缓冲 区 分 配 空间 。 索 引 缓冲 区 和 数据 缓冲 区 的 大 小 在 


apue db.h 中 定义 。 可 以 通过 让 这 些 缓冲 区 按 需 要 动态 扩张 来 增强 数据 库 函 数 
库 。 其 方法 可 以 是 记录 这 两 个 缓冲 区 的 大 小 ， 然 后 在 需要 更 大 的 缓冲 区 时 调用 
reaLloc。 最 后 ， 返 回 指 岗 已 分 配 到 的 DB 结构 的 指针 。 
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[181—188] 


[189—199] 


db close 函数 只 是 一 个 包装 ， 它 将 数据 库 句 柄 强制 类 型 转换 为 DB 结构 的 指针 ， 
将 它 传送 给 db free 通 数 ， 由 该 函数 释放 资源 以 及 DB 结构 。 

db open 在 打开 索引 文件 和 数据 文件 时 如 果 发 生 错误 ， 会 调用 _db_free 函数 释 
放 资 源 。 应 用 程序 在 结束 对 数据 库 的 使 用 后 ，db_close 也 会 调用 _db_free。 如 
果 数 据 库 索 引文 件 的 文件 描述 符 有 效 ， 那 么 关闭 该 文件 。 对 数据 文件 描述 符 也 进 
行 同样 处 理 。( 回 忆 在 _ab_al1loc 中 分 配 一 个 新 的 DB 结构 时 , 将 每 个 文件 描述 符 
都 初始 化 为 一 1。 如 果 不 能 打开 两 个 数据 库 文件 中 的 一 个 ， 相 应 文件 描述 符 仍 为 一 1， 
也 就 是 无 需 关 闭 它 。) 


200 if (db->idxbuf != NULL) 


201 


free(db-»idxbuf); 


202 if (db->datbuf !- NULL) 


203 


free (db-»datbuf); 


204 if (db->name != NULL) 


free (db->name) ; 


209 * Fetch a record. Return a pointer to the null-terminated data. 


212 db_fetch(DBHANDLE h, const char *key) 


*db = h; 


205 

206 free (db); 
207 } 

208 /* 

210 */ 

211 char * 

213 | 

214 DB 

215 char 


*ptr; 


216 if ( db find and lock(db, key, 0) < 0) { 


217 ptr = NULL; /* error, record not found */ 
218 db->cnt_fetcherrt+; 

219 } else { 

220 ptr = db readdat (db); /* return pointer to data */ 
221 db->cnt_fetchok++; 

222 } 

223 /* 

224 * Unlock the hash chain that db find and lock locked. 
225 af 


226 if (un lock(db-»idxfd, db-»chainoff, SEEK SET, 1) < 0) 


227 


err_dump("db fetch: un_lock error"); 


228 return (ptr)? 


229 } 


[200—207] 


[208—218] 


接着 ， 释 放 动 态 分 配 的 缓冲 区 。 可 以 安全 地 将 一 个 空 指 针 传 递 给 free 函数 ， 这 
样 也 就 无 需 事先 检查 每 个 缓冲 区 指针 的 值 ， 但 是 我 们 认为 只 释放 已 分 配 的 对 象 是 
一 种 较 好 的 编程 风格 。( 并 非 所 有 释放 程序 都 像 free 那样 容忍 差错 。) Bn. 
放 DB 结构 占用 的 存储 区 。 

函数 db fetch 根据 给 定 的 键 来 读 取 一 条 记录 。 它 调用 _db_find_and_lock 在 
数据 库 中 查找 记录 。 若 不 能 找到 该 记录 ， 则 将 返回 值 (ptr) RHA NULL, HA 
成 功 的 记录 搜索 计数 器 值 加 1。 因 为 从 _db_find_and_lock 返回 时 ， 数 据 库 索 
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引文 件 是 加 锁 的 ， 所 以 先 要 解锁 ， 然 后 再 返回 。 


[2319-229] ”如 果 找 到 了 记录 , Wi do readdat 读 相 应 的 数据 记录 , 并 将 成 功 记录 搜索 计数 


230 /* 


231 
232 
233 
234 
235 
236 
237 


238 
239 
240 
241 
242 
243 
244 
245 


246 
247 
248 
249 
250 
251 
252 
253 
254 
255 
256 


257 
258 
259 
260 
261 


* 


* 


*/ 


器 值 加 1。 在 返回 前 ， 调 用 un_lock 对 索引 文件 解锁 。 然 后 ， 返 回 所 找到 记录 的 
指针 〈 如 果 没 有 找到 所 需 记 录 ， 则 返回 NULL)。 


Find the specified record. Called by db delete, db fetch, 
and db store. Returns with the hash chain locked. 


static int 
.db find and lock(DB *db, const char *key, int writelock) 


{ 


off t offset, nextoffset; 


/* 

* Calculate the hash value for this key, then calculate the 
* byte offset of corresponding chain ptr in hash table. 

* This is where our search starts. First we calculate the 
* offset in the hash table for this key. 

* y 

db->chainoff = ( db hash(db, key) * PTR SZ) + db->hashoff; 
db-»ptroff = db->chainoff; 


/* 
* We lock the hash chain here. The caller must unlock it 
* when done. Note we lock and unlock only the first byte. 
*/ 
if (writelock) { 
if (writew lock(db-»idxfd, db-»chainoff, SEEK SET, 1) < 0) 
err dump(" db find and lock: writew lock error"); 
} else { 
if (readw_lock(db->idxfd, db->chainoff, SEEK SET, 1) < 0) 
err dump(" db find and lock: readw lock error"); 
) 


/* 

* Get the offset in the index file of first record 
* on the hash chain (can be 0). 

*/ 

offset = db readptr(db, db->ptroff); 


[330—237] | db find and lock 函数 在 函数 库 内 部 用 于 按 给 定 的 键 查找 记录 。 在 搜索 记录 


时 ， 如 果 想 在 索引 文件 上 加 一 把 写 锁 ， 则 将 writelock 参数 设置 为 非 0 值 。 如 
果 将 writelock 参数 设置 为 0， 则 在 搜索 记录 时 ， 在 索引 文件 上 加 读 锁 。 


[238 一 256] ”在 db find and lock 中 准备 遍历 散 列 链 。 将 键 转换 为 散 列 值 ， 用 其 计算 在 文 


262 
263 


件 中 相应 散 列 链 的 起 始 地 址 (chainoff)。 在 遍历 散 列 链 前 ， 等 待 获得 锁 。 注 意 ， 
只 锁 该 散 列 链 开始 处 的 第 1 个 字 节 。 这 种 方式 允许 多 个 进程 同时 搜索 不 同 的 散 列 
链 ， 因 此 增加 了 并 发 性 。 


[257—261] ”调用 _db_readptr 读 散 列 链 中 的 第 一 个 指针 。 如 果 该 函数 返回 0， 则 该 散 列 链 为 空 。 


while (offset != 0) { 


nextoffset = db readidx(db, offset); 
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274 
275 
276 
277 
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} 


if 


{strcmp (db->idxbuf, key) == 0) 
break; /* found a match */ 


db->ptroff = offset; /* offset of this (unequal) record */ 
offset - nextoffset; /* next one to compare */ 


} 
/* 


* offset == 0 on error (record not found). 


*/ 


return (offset == 0? -1 : 0); 


/* 
* Calculate the hash value for a key. 


vf 


static DBHASH 


278 | db hash(DB *db, const char *key) 

279 ( 

280 DBHASH hval = 0; 

281 char C; 

282 int i; 

283 for (i = 1; (c = *keyt+) != 0; i++) 

284 hval += c * i; /* ascii char times its l-based index */ 

285 return(hval % db-»nhash); 

286 ] 

[262—268] while 循环 遍历 散 列 链 中 的 每 一 条 索引 记录 , 并 比较 键 . 调用 函数 db readidx 
读 取 每 条 索引 记录 。 它 将 当前 记录 的 键 填 入 DB 结构 中 的 idxbuf 字段 。 如 果 
_db_readidx 返回 0， 则 已 到达 散 列 链 的 最 后 一 记录 项 。 

[269—273] ”如 果 在 循环 后 ，offset 为 0， 说 明 已 达到 散 列 链 末 端 而 且 没有 找到 匹配 键 ， 于 是 
返回 一 1。 否 则 ， 找 到 了 匹配 记录 (用 break 语句 退出 了 循环 )， 所 以 返回 0 表示 成 
功 。 此 时 ， ptroff 字段 包含 前 一 索引 记录 的 地 址 ， datoff 包含 数据 记录 的 地 址 ， 
datlen 是 数据 记录 的 长 度 。 当 沿 着 散 列 链 进行 遍历 时 ， 必 须 始终 保存 当前 索引 记 
录 的 前 一 条 索引 记录 ， 其 中 有 一 个 指针 指向 当前 索引 记录 。 这 样 做 在 删除 一 条 记录 
时 很 有 用 ， 因 为 必须 修改 当前 索引 记录 的 前 一 条 记录 的 链 指针 以 删除 当前 记录 。 

[274—286] ^ db hash 根据 给 定 的 键 计算 散 列 值 。 它 将 键 中 的 每 一 个 ASCI 字符 乘 以 这 个 字 
符 在 字符 串 中 以 1 开始 的 索引 号 ， 将 这 些 结 果 加 起 来 ， 除 以 散 列表 记录 项 数 ， 将 
余数 作为 这 个 键 的 散 列 值 。 回 忆 散 列表 记录 项 数 是 137， 它 是 一 个 素数 ， 按 
Knuth[1998]， 素 数 散 列 通常 能 提供 良好 的 分 布 特性 。 

287 /* 

288  * Read a chain ptr field from anywhere in the index file: 

289 * the free list pointer, a hash table chain ptr, or an 

290  * index record chain ptr. 

291  */ 

292 static off t 

293 db readptr(DB *db, off t offset) 

294 í 

295 char asciiptr[PTR SZ * 1]; 

296 if (lseek(db->idxfd, offset, SEEK SET) == -1) 





297 
298 
299 
300 
301 
302 


303 
304 
305 
306 
307 
308 
309 
310 
311 
312 
313 
314 
315 
316 


! 
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err dump(" db readptr: lseek error to ptr field"); 
if (read(db->idxfd, asciiptr, PTR SZ) !- PTR SZ) 

err dump(" db readptr: read error of ptr field"); 
asciiptr[PTR SZ] = 0; /* null terminate */ 
return(atol(asciiptr)); 


* Read the next index record. We start at the specified offset 
* in the index file. We read the index record into db->idxbuf 
* and replace the separators with null bytes. If all is OK we 
* set db-»datoff and db->datlen to the offset and length of the 
* corresponding data record in the data file. 


static off t 


_ 


{ 


db readidx(DB *db, off t offset) 


ssize t i: 
char *ptrl, *ptr2; 
char asciiptr[PTR SZ + 1], asciilen[IDXLEN, SZ + 1]; 


struct iovec iov(2]; 


[287~302] _db_readptr 函数 读 取 以 下 3 种 不 同 链表 指针 中 的 任意 一 种 : (a) 索引 文件 最 开 


始 处 指向 空闲 链表 中 第 一 个 索引 记录 的 指针 ，(b)》 散 列 表 中 指向 散 列 链 的 第 一 条 
索引 记录 的 指针 ,，(c) 存放 在 每 条 索引 记录 开始 处 、 指 向 下 一 条 记录 的 指针 〈 这 
里 的 索引 记录 既 可 以 处 于 一 条 散 列 链表 中 ， 也 可 以 处 于 空闲 链表 中 )。 返 回 前 ， 将 
指针 从 ASCI 形式 转换 为 长 整 型 。 此 函数 不 进行 任何 加 锁 操 作 ， 所 以 其 调用 者 应 
事先 做 好 必要 的 加 锁 。 


[303—316] ^ db readidx 函数 用 于 从 索引 文件 的 指定 偏 移 量 处 读 取 索 引 记录 。 如 果 成 功 , 该 


317 
318 
319 
320 
321 
322 
323 
324 


325 
326 
327 
328 
329 
330 
331 
332 
333 


函数 将 返回 链表 中 下 一 条 记录 的 偏 移 量 。 该 函数 还 填充 DB 结构 的 许多 字段 : 
idxoff 包含 索引 文件 中 当前 记录 的 偏 移 量 ,ptrval 包含 在 散 列 链表 中 下 一 个 索 
引 项 的 偏 移 量 ，idxlen 包含 当前 索引 记录 的 长 度 ，idxbuf 包含 实际 索引 记录 ， 
datoff 包含 数据 文件 中 该 记录 的 偏 移 量 ，dat1len 包含 该 数据 记录 的 长 度 。 


/* 
* Position index file and record the offset. db nextrec 
* calls us with offset--0, meaning read from current offset. 
* We still need to call lseek to record the current offset. 
* y 
if ((db-»idxoff = lseek(db-»idxfd, offset, 
offset == 0 ? SEEK CUR : SEEK SET)) == -1) 
err dump(" db readidx: lseek error"); 


/* 
* Read the ascii chain ptr and the ascii length at 
* the front of the index record. This tells us the 
* remaining size of the index record. 
ay. 

iov[01]1.iov base = asciiptr; 

iov[0].iov len = PTR_S2; 

iov[1].iov base = asciilen; 

iov[l].iov len = IDXLEN S2; 
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334 
335 
336 
337 
338 


339 
340 
341 
342 
343 


344 
345 
346 
347 





if ((i = readv(db->idxfd, &iov[0], 2)) != PTR SZ + IDXLEN SZ) { 
if (i == 0 && offset == 0) 
return(-1): /* EOF for db nextrec */ 
err dump(" db readidx: readv error of index record"); 


/* 
* This is our return value; always »- O0. 
*/ 

asciiptr[PTR S2] = 0; /* null terminate */ 


db-»ptrval = toll(asciiptr); /* offset of next key in chain */ 


asciilen[IDXLEN SZ] = 0; /* null terminate */ 
if ((db->idxlen = atoi(asciilen)) < IDXLEN MIN | | 
db->idxlen > IDXLEN MAX) 
err dump(" db readidx: invalid length"); 


[317—324] ” 按 调 用 者 提供 的 参数 查找 索引 文件 偏 移 量 。 在 DB 结构 中 记录 该 偏 移 量 , 为 此 即使 


调用 者 想 要 在 当前 文件 偏 移 量 处 读 记 录 (设置 offset HO), 仍 需 要 调用 1seek 
以 确定 当前 偏 移 量 。 因 为 在 索引 文件 中 ， 索 引 记 录 决 不 会 存放 在 偏 移 量 为 0 处 ， 
所 以 可 以 放心 地 使 用 0 表示 “从 当前 偏 移 量 处 读 ”。 


[325—338] ”调用 readv 读 在 索引 记录 开始 处 的 两 个 定 长 字段 : 指向 下 一 索引 记录 的 链 指针 和 


该 索引 记录 余下 部 分 的 长 度 〈 余 下 部 分 是 变 长 的 )。 


[339~347] ”将 下 一 记录 的 偏 移 量 转换 为 整 型 ， 并 存放 到 ptrval 字段 中 《这 将 被 用 作 此 函数 


348 
349 
350 
351 
352 
353 
354 
355 
356 


357 
358 
359 
360 
361 
362 


363 
364 
365 


366 
367 


368 
369 
370 


的 返回 值 )。 然 后 将 索引 记录 的 长 度 转换 为 整 型 ， 并 存放 到 idxlen 字段 中 。 


* Now read the actual index record. We read it into the key 

* buffer that we malloced when we opened the database. 

*/ 

if ((i = read(db->idxfd, db-»idxbuf, db->idxlen)) != db->idxlen) 
err, dump(" db readidx: read error of index record"); 

if (db-»idxbuf[db-»idxlen-1] != NEWLINE) /* sanity check */ 
err dump(" db readidx: missing newline"); 


db-»idxbuf[db-»idxlen-1] = 0; /* replace newline with null */ 
/* 

* Find the separators in the index record. 

*f 


if ((ptrl = strchr(db-»idxbuf, SEP)) == NULL) 
err dump(" db readidx: missing first separator"); 


*ptrl++ = 0; /* replace SEP with null */ 
if ((ptr2 = strchr(ptrl, SEP)) == NULL) 

err dump(" db readidx: missing second separator"); 
*ptr2++ = 0; /* replace SEP with null */ 
if (strchr(ptr2, SEP) != NULL) 


err dump(" db readidx: too many separators"); 


/* 
* Get the starting offset and length of the data record. 
=/ 


371 
372 
373 
374 
375 
376 


) 


20.8 WR 623 


if ((db-»datoff = atol(ptr1)) < 0} 
err dump(" db readidx: starting offset < 0"); 
if ((db->datlen = atol(ptr2)) <= 0 || db->datlen > DATLEN MAX) 
err dump(" db readidx: invalid length"); 
return(db-»ptrval); /* return offset of next key in chain */ 


[348—356] ”将 索引 记录 的 变 长 部 分 读 入 DB 结构 中 的 idxbuf 字段 。 该 记录 应 以 换行 符 结尾 。 


用 null 字符 代替 换行 符 。 如 果 索 引文 件 已 遭 破 坏 ， 那 么 调用 err dump 函数 终止 
core 文件 。 


[357-367] ”将 索引 记录 划分 成 3 个 字段 : 键 、 对 应 数据 记录 的 偏 移 量 和 数据 记录 的 长 度 。 


strchr 函数 在 给 定 字符 串 中 找到 第 一 个 指定 字符 。 这 里 ， 我 们 要 寻找 的 是 记录 
中 分 隔 字段 的 字符 〈SEP， 此 处 定义 为 冒号 )。 


[368—376] ”将 数据 记录 偏 移 量 和 数据 记录 长 度 转换 为 整 型 ， 并 将 它们 存放 在 DB 结构 中 。 然 


后 ， 返 回 在 散 列 链 中 下 一 条 记录 的 偏 移 量 。 注 意 ， 我 们 并 不 读数 据 记录 ， 这 由 调 
用 者 自己 完成 。 例 如 ， 在 db fetch 中 , fE db find and lock 按键 找到 索引 
记录 前 是 不 读 取 数据 记录 的 。 


/* 


* Read the current data record into the data buffer. 
* Return a pointer to the null-terminated data buffer. 


*/ 


static char * 
.db readdat(DB *db) 


{ 


if (lseek(db->datfd, db->datoff, SEEK SET) == -1) 
err dump(" db readdat: lseek error"); 
if (read(db->datfd, db-»datbuf, db-»datlen) != db-»datlen) 


err dump(" db readdat: read error"); 

if (db-»datbuf[db-»datlen-1] != NEWLINE) /* sanity check */ 
err dump(" db readdat: missing newline"); 

db->datbuf [db->datlen-1] = 0; /* replace newline with null */ 


return (db->datbuf); /* return pointer to data record */ 
} 
/* 
* Delete the specified record. 
af 
int 


db delete(DBHANDLE h, const char *key) 


{ 


DB *db = h; 
int re = 0; /* assume record will be found */ 


if ( db find and lock(db, key, 1) -- 0) I 
.db, dodelete (db) ; 
db->cnt_delok++; 
} else { 
re = -1; /* not found */ 
db->cnt_delerr++; 
) 
if (un lock(db-»idxfd, db-»chainoff, SEEK SET, 1) < 0) 


768 
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409 
410 
411 


err dump("db delete: un lock error"); 
returnírc); 


) 
[377—392] ”在 datoff 和 datlen 已 经 被 正确 初始 化 后 ，_db_readdat 函数 将 数据 记录 的 


内 容 读 入 DB 结构 中 的 datbuf 字段 指向 的 缓冲 区 。 


[393—411] | db delete 函数 用 于 删除 与 给 定 键 匹 配 的 一 条 记录 。 使 用 db find and lock 


412 
413 
414 
415 
416 
417 
418 
419 
420 
421 
422 


423 
424 
425 
426 
427 
428 
429 
430 
431 


432 
433 
434 
435 
436 


437 
438 
439 
440 


来 判断 在 数据 库 中 该 记录 是 否 存在 。 如 果 存 在 ， 则 调用 _qb_dqodqelete 函数 执行 
删除 该 记录 的 操作 。_qb find and lock 的 第 三 个 参数 控制 对 散 列 链 是 加 读 锁 
还 是 写 锁 。 此 处 ， 因 为 可 能 执行 更 改 该 链表 的 操作 ， 所 以 要 加 一 把 写 锁 。 
.db find and lock 返回 时 ， 这 把 锁 仍 旧 存 在 ， 为 此 不 管 是 否 找到 了 所 需 的 记 
录 ， 都 需要 解除 这 把 锁 。 


* Delete the current record specified by the DB structure. 
* This function is called by db delete and db store, after 
* the record has been located by db find and lock. 

*/ 


static void 
.db dodelete(DB *db) 


{ 


int i; 

char *5tr; 

off t freeptr, saveptr; 

/* 

* Set data buffer and key to all blanks. 
+y 


for (ptr = db->datbuf, i = 0; i < db-»datlen - 1; i++) 
*ptr++ = SPACE; 

*ptr = 0; /* null terminate for _db_writedat */ 

ptr = db-»idxbuf; 

while (*ptr) 
*ptr++ = SPACE; 


/* 

* We have to lock the free list. 

*/ 

if (writew lock(db-»idxfd, FREE OFF, SEEK SET, 1) < 0} 
err dump(" db dodelete: writew lock error"); 


/* 

* Write the data record with all blanks. 

*/ 

.db writedat(db, db->datbuf, db-»datoff, SEEK SET); 


[412—431]  .db dodelete 函数 执行 从 数据 库 中 删除 一 条 记录 的 所 有 操作 。( 该 函数 也 可 以 


由 db store 调用 。.) 此 函数 的 大 部 分 工作 仅仅 是 更 新 空闲 链表 以 及 与 键 对 应 的 散 
列 链 。 当 一 条 记录 被 删除 后 ， 将 其 键 和 数据 记录 设 为 空 。 本 章 后 面 将 提 到 的 函数 
db_nextrec 要 用 到 这 一 点 。 


[432—440] WH writew lock 对 空闲 链表 加 写 锁 ， 这 样 能 防止 两 个 进程 同时 删除 不 同 链表 


441 
442 
443 
444 
445 
446 


447 
448 
449 
450 
451 


452 
453 
454 
455 
456 
457 


458 
459 
460 
461 


462 
463 
464 
465 
466 
467 
468 
469 
470 
471 } 


[441—461] ” 读 空 闲 链 表 指 针 ， 接 着 修改 索引 记录 。 让 这 条 记录 的 下 一 条 记录 指针 指向 空闲 链 
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上 的 记录 时 产生 相互 影响 ， 因 为 要 将 被 删除 的 记录 添加 到 空闲 链表 中 ， 这 将 改变 
空闲 链表 指针 ， 而 一 次 只 能 有 一 个 进程 能 这 样 做 。 

调用 函数 db writedat 清空 数据 记录 。 这 时 _db_writedat 并 不 对 数据 文件 加 
写 锁 ， 这 是 因为 db delete 对 这 条 记录 的 散 列 链 已 经 加 了 写 锁 ， 这 保证 不 会 再 
有 其 他 进程 能 够 读 、 写 这 条 记录 。 


/* 

* Read the free list pointer. Its value becomes the 

* chain ptr field of the deleted index record. This means 
* the deleted record becomes the head of the free list. 

*/ 

freeptr = _db_readptr(db, FREE OFF); 


/* 
* Save the contents of index record chain ptr, 
* before it's rewritten by db writeidx. 

xf 


saveptr = db->ptrval; 


/* 
* Rewrite the index record. This also rewrites the length 

* of the index record, the data offset, and the data length, 
* none of which has changed, but that's OK. 

*/ 


db writeidx(db, db->idxbuf, db->idxoff, SEEK SET, freeptr); 


/* 
* Write the new free list pointer. 
wy 


db writeptr(db, FREE OFF, db->idxoff); 


/* 
* Rewrite the chain ptr that pointed to this record being 

* deleted. Recall that db find and lock sets db->ptroff to 
* point to this chain ptr. We set this chain ptr to the 

* contents of the deleted record's chain ptr, saveptr. 


*/ 


.db writeptr(db, db->ptroff, saveptr); 


if (un lock(db-»idxfd, FREE OFF, SEEK SET, 1) < 0) 
err dump(" db dodelete: un lock error"); 


表 的 第 一 条 记录 〔 如 果 空 闲 链表 为 空 ， 则 这 个 新 的 链表 指针 置 为 0，。 清 除 键 之 后 
用 正 被 删除 索引 记录 的 偏 移 量 更 新 空闲 链表 指针 ， 也 就 是 使 其 指向 当前 删除 的 这 
条 记录 。 这 意味 着 空闲 链表 的 处 理 基于 后 进 先 出 《虽然 是 以 首次 适应 算法 来 删除 
空闲 链表 项 )， 也 就 是 说 被 删除 的 记录 都 被 添加 到 空闲 链表 头 部 。 

没有 为 每 个 文件 分 别 设置 空闲 链表 。 将 一 个 删除 的 索引 记录 添加 到 空闲 链表 时 ， 该 
索引 记录 仍 指向 已 删除 的 数据 记录 。 当 然 还 有 更 好 的 处 理 方 法 ， 但 复杂 性 会 增加 。 


[462—471] ”修改 散 列 链 中 前 一 条 记录 的 指针 ， 使 其 指向 正 删 除 记 录 之 后 的 记录 ， 这 样 就 从 散 


列 链 中 移 除了 要 删除 的 记录 。 最 后 对 空闲 链表 解锁 。 
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472 /* 

473 * Write a data record. Called by db dodelete (to write 

414 * the record with blanks) and db store. 

475 */ 

476 static void 

477 db writedat(DB *db, const char *data, off t offset, int whence) 


478 | 

479 struct iovec iov[2]: 

480 static char newline = NEWLINE; 

481 /* 

482 * If we're appending, we have to lock before doing the lseek 
483 * and write to make the two an atomic operation. If we're 
484 * overwriting an existing record, we don't have to lock. 
485 *y 

486 if (whence -- SEEK END) /* we're appending, lock entire file */ 
487 if (writew lock(db-»datfd, 0, SEEK SET, 0) < 0) 

488 err dump(" db writedat: writew lock error"); 

489 if ((db->datoff = lseek(db-»datfd, offset, whence)) == -1) 
490 err dump(" db writedat: lseek error"); 

491 db->datlen = strlen(data) + 1; /* datlen includes newline */ 
492 iov[0].iov base = (char *) data; 

493 iov[0].iov len = db-»datlen - 1; 

494 iov[1].iov base - &newline; 

495 iov[1].iov len = 1; 

496 if (writev(db->datfd, &iov[0], 2) ‘= db->datlen) 

497 err dump(" db writedat: writev error of data record"); 
498 if (whence -- SEEK END) 

499 if (un lock(db-»datfd, 0, SEEK SET, 0} < 0) 

500 err dump(" db writedat: un lock error"); 

501 ) 


[472—491] ”调用 函数 _db_writedat 写 一 个 数据 记录 。 当 删除 一 记录 时 ， 调 用 函数 _db 
_writedat 清空 数据 记录 ; 这 时 _db_writedat 并 不 对 数据 文件 加 写 锁 ， 因 为 
db delete 对 这 条 记录 的 散 列 链 已 经 加 了 写 锁 ， 这 保证 不 会 再 有 其 他 进程 能 够 
读 、 写 这 条 记录 。 在 本 节 稍 后 处 说 明 db_store 函数 时 ， 会 过 到 db writedat 
函数 追加 写 数据 文件 的 情况 ， 此 时 就 必需 对 该 文件 加 锁 。 
定位 到 要 写 数据 记录 的 位 置 。 要 写 的 字 节 数 是 记录 长 度 加 1 个 字 节 ， 这 1 个 字 节 
是 表示 记录 终止 的 换行 符 。 

[492—501] ”设置 iovec HA, 调用 writev 写 数 据 记 录 和 换行 符 。 不 能 想当然 地 认为 调用 者 
缓冲 区 的 尾 端 有 空间 可 以 追加 换行 符 ， 所 以 应 该 将 换行 符 写 入 另 一 个 缓冲 区 ， 然 
后 再 从 该 缓冲 区 写 至 数据 记录 。 如 果 正 在 对 文件 追加 一 条 记录 ， 那 么 就 释放 早先 
获得 的 锁 。 





502 /* 

503 * Write an index record. .db writedat is called before 
504 * this function to set the datoff and datlen fields in the 
505 * DB structure, which we need to write the index record. 





506 
507 
508 
509 
510 
511 
512 
513 


*/ 


20.8 海 代码 627 


static void 
.db writeidx(DB *db, const char *key, 


{ 


off t offset, int whence, off t ptrval) 


struct iovec iov[2]; 
char asciiptrlen[PTR SZ + IDXLEN S2 + 1]; 
int len; 


if ((db-»ptrval = ptrval) < 0 [| ptrval > PTR MAX) 
err quit(" db writeidx: invalid ptr: %d", ptrval); 

sprintf(db-»idxbuf, "tstc%lldtctld\n", key, SEP, 

(long long)db->datoff, SEP, (long)db-»datlen); 
len = strlen(db-»idxbuf); 
if (len < IDXLEN MIN || len > IDXLEN, MAX) 

err dump(" db writeidx: invalid length"); 

sprintf(asciiptrlen, "$*11d$*d", PTR S2, (long long)ptrval, 
IDXLEN SZ, len); 


/* 
* If we're appending, we have to lock before doing the lseek 
* and write to make the two an atomic operation. If we're 
* overwriting an existing record, we don't have to lock. 
xy 

if (whence -- SEEK END) /* we're appending */ 

if (writew lock(db-»idxfd, ((db->nhash+1)*PTR_S2)+1, 
SEEK SET, 0) < 0) 
err dump(" db writeidx: writew lock error"); 


[502—522] 18H do writeidx 函数 写 一 条 索引 记录 。 在 验证 散 列 链 中 下 一 个 指针 有 效 后 ， 


创建 索引 记录 ， 并 将 它 的 后 半 部 分 存放 到 idxbuf 中 。 需 要 索引 记录 这 一 部 分 的 
长 度 以 创建 该 记录 的 前 半 部 分 ， 而 前 半 部 分 被 存放 到 局 部 变量 asciiptrlen 中 。 

注意 ， 使 用 强制 类 型 转换 使 得 sprintf 语句 的 参数 的 长 度 与 格式 说 明 中 相 匹 配 ， 
这 样 做 是 因为 off_t 和 size t 数据 类 型 的 长 度 因 平台 不 同 而 不 同 。32 位 系统 也 
能 提供 64 位 文件 偏 移 量 ， 所 以 不 能 假定 of f_t 数据 类 型 的 长 度 。 


[523—531] ”和 _db_writedat 一 样 ， 只 有 在 追加 新 索引 记录 时 这 一 函数 才 需 要 加 锁 。 


532 
533 
534 
535 
536 


537 
538 
539 
540 
541 
542 


.db dodelete 调用 此 函数 是 为 了 重 写 一 条 已 有 的 索引 记录 。 在 这 种 情况 下 ， 调 


用 者 已 经 在 散 列 链 上 加 了 写 锁 ， 上 所 以 不 再 需要 加 另外 的 锁 。 
/* 
* Position the index file and record the offset. 
*/ 
if ((db-»idxoff = lseek(db->idxfd, offset, whence)) == -1) 


err dump(" db writeidx: lseek error"); 


iov[0].iov base = asciiptrlen; 

iov[0].iov len = PTR SZ + IDXLEN_SZ; 

iov[1].iov base = db->idxbuf; 

iov[1].iov len = len; 

if (writev(db-»idxfd, &iov[0], 2) != PTR SZ + IDXLEN SZ + len) 
err dump(" db writeidx: writev error of index record"); 
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544 
545 
546 
547 


548 
549 
550 
551 
552 
553 
554 
555 


556 
254 
558 


559 
560 
561 
562 
563 


} 


/* 


if (whence -- SEEK END) 
if (un lock(db-»idxfd, ((db->nhash+1)*PTR_S2Z) +1, 
SEEK SET, 0) < 0) 
err dump(" db writeidx: un lock error"); 


* Write a chain ptr field somewhere in the index file: 
* the free list, the hash table, or in an index record. 


er 


static void 
.db writeptr(DB *db, off t offset, off t ptrval) 


{ 


} 


char asciiptr[PTR SZ + 1]; 


if (ptrval < 0 || ptrval > PTR MAX) 
err quit(" db writeptr: invalid ptr: %d", ptrval); 
sprintf(asciiptr, "$*11d", PTR SZ, (long long)ptrval); 


if (lseek(db-»idxfd, offset, SEEK SET) -- -1) 
err dump(" db writeptr: lseek error to ptr field"); 
if (write(db-»idxfd, asciiptr, PTR SZ) != PTR SZ) 


err dump(" db writeptr: write error of ptr field"); 


[532—547] ”定位 到 开始 写 索 引 记录 的 位 置 ， 将 该 偏 移 量 存 入 DB 结构 的 idxoff FR. AA 


在 两 个 独立 的 缓冲 区 中 构建 索引 记录 , 所 以 调用 writev 将 它 存放 到 索引 文件 中 。 
如 果 是 追加 写 该 文件 ， 则 释放 在 定位 操作 前 获得 的 锁 。 从 并 发 运行 进程 追加 新 记 
录 到 数据 库 的 角度 思考 问题 ， 那 么 这 把 锁 使 定位 操作 和 写 操作 成 为 原子 操作 。 


[548—563] ^ db writeptr 被 用 于 将 一 散 列 链 指针 写 至 索引 文件 中 。 验 证 该 指针 在 索引 文件 
的 边界 范围 内 ， 然 后 将 它 转 换 成 ASCI 字符 串 。 按 指定 的 偏 移 量 在 索引 文件 中 定 
位 ， 然 后 将 该 指针 ASCII 字符 串 写 入 索引 文件 。 

564 /* 

565  * Store a record in the database. Return 0 if OK, 1 if record 

566 * exists and DB INSERT specified, -1 on error. 

567  */ 

568 int 

569 db store(DBHANDLE h, const char *key, const char *data, int flag) 

570 | 

571 DB *db = h; 

572 int rc, keylen, datlen; 

573 off t ptrval; 

574 if (flag !- DB INSERT && flag !- DB REPLACE && 

575 flag != DB STORE) { 

576 errno - EINVAL; 

577 return{-1); 

578 } 

579 keylen = strlen(key); 

580 datlen = strlen(data) + 1; /* +1 for newline at end */ 

581 if (datlen < DATLEN MIN |] datlen > DATLEN MAX) 

582 err dump("db store: invalid data length"); 
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583 /* 

584 * db find and lock calculates which hash table this new record 
585 * goes into (db-»chainoff), regardless of whether it already 
586 * exists or not. The following calls to db writeptr change the 
587 * hash table entry for this chain to point to the new record. 
588 * The new record is added to the front of the hash chain. 

589 *y 

590 if ( db find and lock(db, key, 1) « 0) { /* record not found */ 
591 if (flag == DB REPLACE) { 

592 rc - -1; 

593 db-»cnt storerrtt; 

594 errno = ENOENT; /* error, record does not exist */ 
595 goto doreturn; 

596 } 


[564—582] db store 函数 的 功能 是 将 一 条 记录 添加 到 数据 库 中 。 首 先 验证 参数 flag fM. 
然后 ， 检 查 数 据 记录 长 度 是 否 有 效 。 如 果 无 效 ， 则 删除 core 文件 并 终止 。 作 为 一 
个 例子 这 样 处 理 无 可 厚 非 ， 但 如 果 构 造 正 式 应 用 的 函数 库 ， 那 么 最 好 返回 出 错 状 
态 而 非 终 止 ， 这 样 可 以 给 应 用 程序 一 个 恢复 的 机 会 。 

[583—596] ”调用 _db_find and lock 以 查看 这 个 记录 是 否 已 经 存在 ,如 果 记 录 并 不 存在 且 指 定 
的 标志 为 DB_INSERT 或 DB_STORE， 或 者 记录 存在 且 指 定 的 标志 为 DB_REPLACE 
或 DB_STORE， 那 么 这 些 都 是 允许 的 。 替 换 一 条 已 有 的 记录 意味 着 键 不 变 ， 而 数 
据 记 录 很 可 能 不 同 。 注 意 ， 因 为 db store 很 可 能 会 改变 散 列 链 ， 所 以 调用 


_db_find_and_lock 的 最 后 一 个 参数 指明 要 对 散 列 链 加 写 锁 。 
597 /* 
598 * db find and lock locked the hash chain for us; read 
599 * the chain ptr to the first index record on hash chain. 
600 wy 
601 ptrval = db readptr(db, db-»chainoff); 
602 if ( db findfree(db, keylen, datlen) < 0) | 
603 /* 
604 * Can't find an empty record big enough. Append the 
605 * new record to the ends of the index and data files. 
606 *y 
607 _db writedat(db, data, 0, SEEK END); 
608 .db writeidx(db, key, 0, SEEK END, ptrval); 
609 二 
610 * db-»idxoff was set by db writeidx. The new 
611 * record goes to the front of the hash chain. 
612 x 
613 .db writeptr(db, db-»chainoff, db->idxoff); 
614 db-»cnt storl-4*; 
615 } else { 
616 /* 
617 * Reuse an empty record. db findfree removed it from 
618 * the free list and set both db->datoff and db->idxoff. 
619 * Reused record goes to the front of the hash chain. 


620 aes 
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621 .db writedat(db, data, db-»datoff, SEEK SET); 

622 .db writeidx(db, key, db-»idxoff, SEEK SET, ptrval); 

623 .db writeptr(db, db->chainoff, db->idxoff); 

624 db->cnt_stor2++; 

625 } 

[597~601] ”在 调用 _db_find_and_lock 后 ， 代 码 分 成 4 种 情况 。 前 两 种 情况 中 ， 没 有 找到 
足够 大 的 空闲 记录 ， 所 以 添加 一 条 新 纪录 。 读 散 列 链 上 第 一 项 的 偏 移 量 。 

[602—614] ”第 1 种 情况 ， 调用 _ab_finafree 在 空闲 链表 中 搜索 一 条 已 删除 的 记录 ， 它 的 键 
长 度 和 数据 长 度 与 参数 keylen 和 datlen 相同 。 如 果 没 有 找到 对 应 大 小 的 空闲 
记录 ， 这 意 昧 着 要 将 这 条 新 记录 追加 到 索引 文件 和 数据 文件 的 末尾 。 调 用 _db 
_writedat 写 数据 部 分 , 调用 _db_writeidx 写 索引 部 分 ， 调用 _qb_writeptr 
将 新 记录 添加 到 对 应 的 散 列 链 的 头 部 。 将 执行 此 种 情况 的 计数 器 (cnt_stor1) 
值 加 1， 以 便 观 察 数据 库 的 运行 状况 。 

[015—625] ”第 2 种 情况 : db findfree 找到 对 应 大 小 的 空 记 录 ， 然 后 将 这 条 空 记录 从 
空闲 链表 中 移 除 ( 稍 后 就 会 看 到 _db_findfree 的 实现 ), 写 入 新 的 索引 记录 
和 数据 记录 ， 然 后 ， 如 同 第 1 种 情况 一 样 ， 将 新 记录 添加 到 对 应 的 散 列 链 的 
头 部 。 将 执行 此 种 情况 的 计数 器 Cont stor2) 值 加 1， 以 便 观 察 数 据 库 的 

626 } else { /* record found */ 

627 if (flag == DB INSERT) { 

628 re s 1; /* error, record already in db */ 

629 db->cnt_storerrt++; 

630 goto doreturn; 

631 } 

632 /* 

633 * We are replacing an existing record. We know the new 

634 * key equals the existing key, but we need to check if 

635 * the data records are the same size. 

636 */ 

637 if (datlen != db-»datlen) { 

638 _db dodelete(db); /* delete the existing record */ 

639 £* 

640 * Reread the chain ptr in the hash table 

641 * (it may change with the deletion). 

642 */ 

643 ptrval = db readptr(db, db->chainoff}; 

644 /* 

645 * Append new index and data records to end of files. 

646 xf 

647 db writedat(db, data, 0, SEEK END); 

648 .db writeidx(db, key, 0, SEEK END, ptrval); 

649 /* 

650 * New record goes to the front of the hash chain. 

651 xy 

652 .db writeptr(db, db-»chainoff, db->idxoff); 
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653 db-»cnt stor344; 
654 } else { 


[626—631] 。” 另 两 种 情况 是 具有 相同 键 的 记录 在 数据 库 中 已 存在 ， 如 果 不 想 替换 该 记录 ， 则 设 
置 表示 一 条 记录 已 经 存在 的 返回 码 ， 将 存储 出 错 计数 的 计数 器 cnt storerr fff 
加 1， 然 后 跳 转 至 函数 末尾 ， 在 此 处 理 公 共 返 回 逻 辑 。 

[632—654] ”第 3 种 情况 : 要 替换 一 条 已 有 记录 ， 而 新 数据 记录 的 长 度 与 已 有 记录 的 长 度 不 一 
FÉ. 调用 _db_dodelete 删除 已 有 记录 , 将 该 删除 记录 放 在 空闲 链表 头 部 。 然 后 ， 
调用 db writedat fi db writeidx 将 新 记录 追加 到 索引 文件 和 数据 文件 的 
RE 〈 也 可 以 用 其 他 方法 ， 如 可 以 再 找 一 找 是 否 有 数据 大 小 正好 的 已 删除 的 记录 
项 )。 最 后 调用 do writeptr 将 新 记录 添加 到 对 应 的 散 列 链 的 头 部 。DB 结构 中 


的 cnt stor3 计数 器 记录 发 生 此 种 情况 的 次 数 。 776 
655 /* 
656 * Same size data, just replace data record. 
657 */ 
658 db writedat(db, data, db-»datoff, SEEK SET); 
659 db->cnt_stor4++; 
660 } 
661 } 
662 re = 0; /* OK */ 


663 doreturn:  /* unlock hash chain locked by db find and lock */ 


664 if (un lock(db-»idxfd, db->chainoff, SEEK SET, 1) < 0} 
665 err dump("db store: un lock error"); 

666 returnírc); 

667 } 

668 /* 


669 * Try to find a free index record and accompanying data record 
670 * of the correct sizes. We're only called by db store. 

671 .*/ 

672 static int 

673 db findfree(DB *db, int keylen, int datlen) 


674 ff 

675 int re; 

676 off_t offset, nextoffset, saveoffset; 

677 {* 

678 * Lock the free list. 

679 */ 

680 if (writew lock(db-»idxfd, FREE OFF, SEEK SET, 1) < 0) 
681 err dump(" db findfree: writew lock error"); 
682 £* 

683 * Read the free list pointer. 

684 */ 

685 saveoffset - FREE OFF; 

686 offset - db readptr(db, saveoffset); 


[655—661] 84 种 情况 替换 一 条 已 有 记录 ， 而 新 数据 记录 的 长 度 与 已 有 记录 的 长 度 恰好 一 
样 。 这 是 最 容易 的 情况 , 只 需要 重 写 数 据 记 录 即 可 , 并 将 这 种 情况 的 计数 器 (cnt_ 


Ex 
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stor4) 值 加 1。 


[662—667] ”在 正常 情况 下 ， 设 置 表示 成 功 的 返回 码 ， 然 后 进入 公共 返回 逻辑 。 对 散 列 链 解 锁 


(这 把 锁 是 由 调用 _db_fing and lock 而 加 上 的 )， 然 后 返回 调用 者 。 


[668—686] ^ dbfindfree 函数 试图 找到 一 个 指定 大 小 的 空闲 索引 记录 和 相关 联 的 数据 记录 。 
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} 


需要 对 空闲 链表 加 写 锁 以 避免 与 其 他 使 用 空闲 链表 的 进程 互相 影响 。 在 对 空闲 链 
表 加 写 锁 后 ， 得 到 空闲 链表 的 头 指针 地 址 。 


while (offset != 0) { 
nextoffset = _db readidx(db, offset); 
if (strlen(db->idxbuf) == keylen && db->datlen == datlen) 
break; /* found a match */ 
saveoffset = offset; 
offset = nextoffset; 


} 


if (offset == 0) { 
rc = -1; /* no match found */ 
) else ( 


* Found a free record with matching sizes. 

* The index record was read in by db readidx above, 

* which sets db-»ptrval. Also, saveoffset points to 
* the chain ptr that pointed to this empty record on 
* the free list. We set this chain ptr to db-»ptrval, 
* which removes the empty record from the free list. 


ii 
_db writeptr(db, saveoffset, db->ptrval); 
rc = 0; 

/* 


* Notice also that _db readidx set both db->idxoff 
* and db->datoff. This is used by the caller, db_store, 
* to write the new index record and data record. 


xy 
} 
/* 
* Unlock the free list. 
*/ 


if (un lock(db-»idxfd, FREE OFF, SEEK SET, 1) < 0) 
err dump(" db findfree: un lock error"); 
returnírc); 


[687—693] | db findfree 中 的 while 循环 遍历 空闲 链表 以 搜寻 一 个 能 够 匹配 键 长 度 和 数 


据 长 度 的 索引 记录 项 。 在 这 个 简单 的 实现 中 ， 只 有 当 一 个 已 删除 记录 的 键 长 度 及 
数据 长 度 与 要 插入 的 新 记录 的 键 长 度 及 数据 长 度 一 样 时 才 重 用 已 删除 记录 的 空 
间 。 还 有 其 他 更 好 的 算法 ， 但 复杂 度 会 增加 。 


[694—712] ”如 果 找 不 到 所 要 求 键 长 度 和 数据 长 度 的 可 用 记录 ， 则 设置 表示 失败 的 返回 码 。 否 


则 ， 将 已 找到 记录 的 下 一 个 链 指 针 写 至 前 一 记录 的 链表 指针 。 这 样 就 从 空闲 链表 
中 移 除 了 该 记录 。 
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[113—719] ”一 旦 结束 对 空闲 链表 的 操作 ， 立 即 释 放 写 锁 。 然 后 对 调用 者 返回 状态 码 。 
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743 
744 
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749 
750 


/* 


* Rewind the index file for db nextrec. 

* Automatically called by db open. 

* Must be called before first db nextrec. 
*/ 


void 
db rewind(DBHANDLE h) 


{ 


) 


DB *db = h; 
off t offset; 


offset = (db-»nhash + 1) * PTR S2; /* +1 for free list ptr */ 


/* 

* We're just setting the file offset for this process 

* to the start of the index records; no need to lock. 

* 41 below for newline at end of hash table. 

*/ 

if ({db->idxoff = lseek(db-»idxfd, offset41, SEEK SET)) == -1) 
err dump("db rewind: lseek error"); 


/* 


* Return the next sequential record. 

* We just step our way through the index file, ignoring deleted 
* records. db rewind must be called before this function is 

* called the first time. l 

*7 


char * 
db_nextrec (DBHANDLE h, char *key) 


{ 


DB *db = h; 
char Cc; 
char *ptr; 


[720—738] | db rewind 函数 用 于 把 数据 库 重 置 到 “起 始 状态 ” 将 索引 文件 的 文件 偏 移 量 设置 


为 指向 第 一 条 索引 记录 【〈 紧 跟 在 散 列表 之 后 )。( 回 忆 图 20-2 中 索引 文件 的 结构 。) 


[739—750] | db nextrec 函数 返回 数据 库 的 下 一 条 记录 。 返 回 值 是 指向 数据 缓冲 区 的 指针 。 如 


果 调 用 者 提供 的 key 参数 非 空 ， 将 相应 的 键 复制 到 该 缓冲 区 中 。 调 用 者 负责 分 配 可 
以 存放 键 的 足够 大 的 缓冲 区 。 大 小 为 IDXLEN MAX 字 节 的 缓冲 区 足够 存放 任意 键 。 
记录 按 数据 库 文 件 中 存放 的 顺序 逐一 返回 。 也 就 是 说 ， 记 录 并 不 按键 值 大 小 排序 。 
Ay, db nextrec 并 不 跟随 散 列 链表 ， 所 以 已 删除 的 记录 也 会 被 读 取 ， 但 是 不 
向 调用 者 返回 这 种 已 删除 记录 。 

/* > 

* We read lock the free list so that we don't read 

* a record in the middle of its being deleted. 

xy 

if (readw_lock(db->idxfd, FREE OFF, SEEK SET, 1) < 0) 
err dump("db nextrec: readw lock error"); 


778 


780 
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757 do ( 

758 /* 

759 * Read next sequential index record, 

760 ud 

761 if ( db readidx(db, 0) < 0) { 

762 ptr = NULL; /* end of index file, EOF */ 
763 goto doreturn; 

764 ) 

765 £t 

766 * Check if key is all blank (empty record). 

7671 */ 

768 ptr = db-»idxbuf; 

769 while ((c = *ptrt*) != 0 && c == SPACE) 

710 $ /* skip until null byte or nonblank */ 

771 } while (c == 0); /* loop until a nonblank key is found */ 
772 if (key !- NULL) 

773 strcpy (key, db-»idxbuf); /* return key */ 

774 ptr » db readdat(db);/* return pointer to data buffer */ 
715 db-»cnt nextrect*; 


776 doreturn: 


777 if (un lock(db-»idxfd, FREE OFF, SEEK SET, 1) < 0) 
718 err dump("db nextrec: un lock error"); 

779 return(ptr); 

780 } 


[751~756] ”对 空闲 链表 加 读 锁 ， 使 得 正在 读 该 链表 时 ， 其 他 进程 不 能 从 中 移 除 记录 。 
[757~771] ”调用 _Gb_readidx 读 下 一 个 记录 。 传 送 给 该 函数 的 偏 移 量 参数 值 为 0， 以 此 通知 
该 函数 从 当前 偏 移 量 继续 读 索 引 记录 。 因 为 正在 逐条 顺序 读 索 引文 件 ， 所 以 会 读 
到 已 删除 的 记录 。 仪 需 返 回 有 效 记 录 ， 所 以 跳 过 键 是 全 空格 的 记录 《回忆 
_db_dodelete 函数 以 设置 全 空格 方式 清除 键 )。 
[772 一 780] . 当 找 到 一 有 效 键 时 ， 如 果 调 用 者 已 提供 缓冲 区 ， 则 将 该 键 复制 到 该 缓冲 区 。 然 后 
读数 据 记 录 ， 并 将 返回 值 设 置 为 指向 包含 数据 记录 的 内 部 缓冲 区 的 指针 值 。 将 统 
计 计 数 器 值 加 1， 对 空闲 链表 解锁 ， 最 后 返回 指向 数据 记录 的 指针 。 
通常 在 下 列 形式 的 循环 中 使 用 db rewind 和 db_nextrec 这 两 个 函数 : 
db rewind(db); 
while ((ptr = db nextrec(db, key)) != NULL) { 


/* process record */ 
) 


前 面 曾 警告 过 ， 记 录 的 返回 没有 一 定 的 顺序 ， 它 们 并 不 按键 的 顺序 返回 。 

如 果 do nextrec 函数 在 循环 中 被 调用 时 数据 库 正在 被 修改 ， 则 db_nextrec 返回 的 记录 只 
是 变化 中 的 数据 库 在 某 一 时 间 点 的 快照 (snapshot). db_nextrec 被 调用 时 总 是 返回 一 条 “正确 ” 
的 记录 ， 也 就 是 说 它 不 会 返回 一 条 已 删除 的 记录 。 但 有 可 能 一 条 记录 刚 被 db_nextrec 返回 后 就 被 
删除 。 类 似 地 ， 如果 do nextrec 刚 跳 过 一 条 已 删除 的 记录 , 这 条 记录 的 空间 就 被 一 条 新 记录 重用 ， 
除非 用 db rewind 重新 遍历 一 遍 ， 否 则 在 结果 中 看 不 到 这 条 新 的 记录 。 如 果 通 过 db_nextrec 获 
得 一 份 数据 库 的 准确 的 “冻结 ”的 快照 很 重要 ， 则 在 这 段 时 间 内 应 该 不 做 插入 和 删除 操作 。 
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下 面 来 看 db nextrec 使 用 的 加 锁 。 因 为 并 不 使 用 任何 散 列 链表 ,也 不 能 判断 每 条 记录 属于 
哪 条 散 列 链 。 所 以 有 可 能 当 db_nextrec 读 取 一 条 记录 时 ， 其 索引 记录 正在 被 删除 。 为 了 防止 这 
种 情况 ，db_nextrec 对 空闲 链表 加 读 锁 ， 这 样 就 可 避免 与 _ db_dodelete fü db findfree 
相互 影响 。 

在 结束 对 db .c 源 文件 的 说 明之 前 ， 对 向 文件 末尾 追加 索引 记录 或 数据 记录 时 的 加 锁 再 做 
一 些 说 明 。 在 第 1 种 和 第 3 种 情况 中 ，db_store 调用 db writeidx 和 db writedat Hj, 
第 3 个 参数 为 0， 第 4 个 参数 为 SEEK_END。 这 里 ， 第 4 个 参数 作为 一 个 标志 用 来 告诉 这 两 个 
函数 ， 新 的 记录 将 被 追加 到 文件 的 末尾 。_db_writeidx 用 到 的 技术 是 对 索引 文件 加 写 锁 ， 加 
锁 的 范围 从 散 列 链 的 末尾 到 文件 的 末尾 。 这 不 会 影响 其 他 数据 库 的 读 进程 和 写 进程 (这 些 进程 
将 对 散 列 链 加 锁 )， 但 如 果 其 他 进程 此 时 调用 do store 来 追加 数据 则 会 被 锁 住 。 
.db writedat 使 用 的 方法 是 对 整个 数据 文件 加 写 锁 。 同 样 这 也 不 会 影响 其 他 数据 库 的 读 进程 
和 写 进 程 〈 它 们 甚至 不 对 数据 文件 加 锁 )， 但 如 果 其 他 用 户 此 时 调用 db store 来 向 数据 文件 
追加 数据 则 会 被 锁 住 〈 见 习题 20.3)。 
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为 了 测试 这 一 数据 库 函数 库 ， 也 为 了 获得 一 些 与 典型 应 用 的 数据 访问 模式 有 关 的 时 间 测 量 数 
据 ， 编 写 了 一 个 测试 程序 。 该 程序 接受 两 个 命令 行 参 数 : 要 创建 的 子 进程 的 个 数 和 每 个 子 进程 向 
数据 库 写 的 数据 记录 的 条 数 (nrec)。 然 后 (通过 调用 db_open) 创建 一 个 空 的 数据 库 , 通过 fork 
创建 指定 数目 的 子 进程 ， 等 待 所 有 子 进程 结束 。 每 个 子 进程 执行 以 下 步骤 。 781 

C) 向 数据 库 写 nrec 条 记录 。 

(2) 通过 键 值 读 回 mec 条 记录 。 

(3) 执行 下 面 的 循环 nrecX5 次 。 

(a) 随机 读 一 条 记录 。 

Cb) 每 循环 37 次 ， 随 机 删除 一 条 记录 。 

(c) 每 循环 11 次 ， 随 机 插入 一 条 记录 并 读 取 这 条 记录 。 

(d) 每 循环 17 次 ， 随 机 替换 一 条 记录 为 新 记录 。 在 连续 两 次 替换 中 ， 一 次 用 同样 大 小 的 记 
录 蔡 换 ， 一 次 用 比 以 前 更 长 的 记录 替换 。 

(4) 将 此 子 进程 写 的 所 有 记录 删除 。 每 删除 一 条 记录 ， 随 机 地 查找 10 条 记录 。 

DB 结构 的 cnt xxx 变量 记录 对 数据 库 进 行 的 操作 数 ， 这 些 变量 的 值 在 函数 中 增加 。 每 个 子 
进程 的 操作 数 一 般 都 会 与 其 他 子 进程 不 一 样 ， 因 为 每 个 子 进程 用 来 选择 记录 的 随机 数 生成 器 是 根 
据 其 进程 ID 来 初始 化 的 。 每 个 子 进 程 操 作 的 典型 计数 值 见 图 20-6。 

读 取 的 次 数 大 约 是 存储 和 删除 的 10 倍 ， 这 可 能 是 许多 数据 库 应 用 程序 的 典型 情况 。 

每 一 个 子 进程 只 对 该 子 进 程 所 写 的 记录 执行 这 些 操 作 《〈 读 取 、 存 储 和 删除 )。 由 于 所 有 的 子 
进程 对 同一 个 数据 库 进行 操作 《虽然 对 不 同 的 记录 )， 所 以 会 使 用 并 发 控制 。 数据库 中 的 记录 总 
数 与 子 进程 数 成 比例 。( 当 只 有 一 个 子 进程 时 ， 一 开始 有 nece 条 记录 写 入 数据 库 ， 当 有 两 个 子 进 
程 时 ， 一 开始 有 nrecX2 条 记录 写 入 数据 库 ， 依 此 类 推 。) 

通过 运行 测试 程序 的 3 个 不 同 版 本 来 比较 加 粗 粒 度 锁 和 加 细 粒 度 锁 提 供 的 并 发 ， 并 且 比 较 3 
种 不 同 的 加 锁 方 式 〈 不 加 锁 、 建 议 性 锁 和 强制 性 锁 )。 第 一 个 版 本 使 用 20.8 节 中 的 源 代码 ， 称 为 
细 粒 度 锁 版 本 。 第 二 个 版 本 通过 改变 加 锁 调 用 而 使 用 粗 粒度 锁 ，20.6 节 对 此 已 介绍 过 。 第 三 个 版 
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本 将 所 有 加 锁 例 程 均 去 掉 ， 这 样 可 以 计算 出 加 锁 的 开销 。 通 过 改变 数据 库 文件 的 权限 标志 位 ， 还 
可 以 使 第 一 个 版 本 和 第 二 个 版 本 《加 细 粒 度 锁 和 加 粗 粒 度 锁 》 使 用 建议 性 锁 或 强制 性 锁 〈 本 节 所 
有 的 测试 中 ， 仅 对 加 细 粒 度 锁 的 实现 测量 了 采用 强制 性 锁 的 时 间 )。 


调用 fcnt1 【每 个 操作 ) 操作 计数 
| WES | 细 粒 度 锁 | (nrec-2000) 


db store. DB, INSERT, | db_store、DB_INSERT， 无 空白 记录 ,， 追加 追加 
db_store、DB_INSERT， 重 用 空 自 记录 
db_store、DB_REPLACE， 数 据 长 度 不 同 ， 追 加 
db_store、DB_REPLACE， 数 据 长 度 相同 
db_store， 没 有 找到 记录 
db_fetch， 找 到 记录 
db_fetch， 没 有 找到 记录 
db_delete， 找 到 记录 
db_delete， 没 有 找到 记录 
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20-6 ”每 个 子 进程 操作 的 典型 计数 值 
本 节 所 有 的 测试 都 是 在 一 台 运 行 Linux 3.2.0 的 Intel Core-i5 系统 上 运行 的 。 这 个 系统 拥有 4 


个 内 核 ， 因 此 可 以 允许 至 多 4 个 进程 并 发 运行 。 
1. 单 进程 的 结果 
20-7 显示 了 只 有 一 个 子 进程 运行 的 结果 ，nrec 分 别 为 2000、6000 和 12000. 


(mm [  a-- 
en | xm | onm 
Ts] p t m f 


0.10 | 0.22 | 0.33 0.17 | 0.33 | 0.51 0.13 0.38 0.51 0.14 | 0.43 | 0.58 
0.88 | 2.13 | 3.03 0.99 | 2.52 | 3.53 
5.38 | 12.60 | 18.01 5.53 | 15.03 | 20.60 


2000 
6000 | 0.59 | 1.32 | 1.91 090 | 2.14 | 3.05 
12000 

20-7 单子 进程 、 不 同 的 nrec 和 不 同 的 加 锁 方法 


4.37 | 9.58 | 13.97 5.34 12.63 18.01 

最 后 12 列 显示 的 是 以 秒 为 单位 的 时 间 。 在 所 有 的 情况 下 , 用 户 CPU 时 间 加 上 系统 CPU 时 间 
都 基本 上 等 于 时 钟 时 间 。 这 一 组 测试 受 CPU 限制 而 不 是 受 磁 盘 操 作 限 制 。 

中 间 6 列 (建议 性 锁 〉 对 加 粗 粒度 锁 和 加 细 粒 度 锁 的 结果 基本 一 样 。 这 是 可 以 理解 的 ， 因 为 
对 于 单个 进程 来 说 加 粗 粒度 锁 和 加 细 粒 度 锁 并 没有 区 别 ， 除 了 额外 的 fenti WHA. 

比较 不 加 锁 和 加 建议 性 锁 ， 可 以 看 到 加 锁 调 用 在 系统 CPU 时 间 上 增加 了 32% 一 73%。 即 使 这 
些 锁 实 际 上 并 没有 使 用 过 〔 因 为 只 有 一 个 进程 运行 )，fcnt1 系统 调用 仍 会 有 一 些 时 间 的 开销 。 
FAP? CPU 时 间 对 4 种 不 同 的 加 锁 方 法 基本 上 一 样 , 这 是 因为 用 户 代 码 基本 上 是 一 样 的 (除了 调用 
fcntl 的 次 数 有 些 不 同 )。 

关于 图 20-7 要 注意 的 最 后 一 点 是 强制 性 锁 比 建议 性 锁 增加 了 13% 一 19% 的 系统 CPU 时 间 。 由 于 对 

加 强制 性 细 粒 度 锁 和 加 建议 性 细 粒 度 锁 的 调用 次 数 是 一 样 的 ， 所 以 增加 的 系统 开销 来 自 读 和 写 。 

最 后 的 测试 是 有 多 个 子 进程 的 不 加 锁 的 程序 。 与 预期 的 一 样 ， 结 果 是 随机 的 错误 。 一 般 错 误 
情况 包括 : 添加 到 数据 库 中 的 记录 找 不 到 、 测 试 程序 异常 退出 等 。 几 乎 每 次 运行 测试 程序 ， 都 有 
不 同 的 错误 发 生 。 这 是 典型 的 竞争 条 件 一 多 个 进程 在 没有 任何 加 锁 的 情况 下 修改 同一 个 文件 ， 
错误 情况 不 可 预测 。 
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2. 多 进程 的 结果 
下 一 组 测试 主要 目的 是 比较 粗 粒 度 锁 和 细 粒 度 锁 的 不 同 。 前 面 说 过 ， 由 于 加 细 粒 度 锁 时 数据 
库 的 各 个 部 分 被 锁 住 的 时 间 比 加 粗 粒 度 锁 少 ， 所 以 从 直觉 上 说 ， 加 细 粒 度 锁 应 该 能 提供 更 好 的 并 
发 性 。 图 20-8 显示 了 nrec 取 2000， 子 进程 数 从 1 一 16 的 测试 结果 。 
建议 性 锁 


1 
2 
3 
4 
5 
6 
7 
8 





图 20-8 ”nrec=2000 时 不 同 加 锁 方 法 的 比较 

所 有 的 用 户 时 间 、 系 统 时 间 和 和 时钟 时 间 的 单位 均 为 秒 。 所 有 这 些 时 间 均 是 父 进 程 与 所 有 子 进 
程 的 总 和 。 关 于 这 些 数 据 有 许多 需要 考虑 。 

首先 要 注意 的 是 ， 当 使 用 多 进程 时 ， 用 户 时 间 和 系统 时 间 之 和 超过 了 时 钟 时 间 。 乍 看 起 来 这 
有 点 奇怪 ， 不 过 当 采 用 多 核 时 是 正常 的 。 此 时 ， 所 有 并 发 的 进程 在 运行 时 其 时 间 会 累积 起 来 ， 所 
显示 的 CPU 处 理 时 间 是 程序 运行 的 所 有 核 运 转 的 时 间 之 和 。 因为 可 以 并 发 多 个 进程 (每 个 核 运行 
一 个 进程 )， 所 以 CPU 处 理 时 间 会 超过 时 钟 时 间 。 

第 8 列 (标记 为 “A 时钟 ”), 是 加 建议 性 粗 粒 度 锁 与 加 建议 性 细 粒 度 锁 的 运行 时 钟 时 间 的 百分比 
差 。 从 中 可 以 看 到 使 用 细 粒 度 锁 得 到 了 多 大 的 并 发 性 。 在 运行 测试 的 系统 上 ， 对 于 单一 进程 加 粗 粒 度 
锁 与 加 细 粒 度 锁 相 比 效果 几乎 相同 。 而 对 于 多 进程 ， 使 用 粗 粒度 锁 的 时 间 消 耗 会 增 大 〈 约 30%)。 

我 们 希望 从 粗 粒度 锁 到 细 粒 度 锁 时 钟 时 间 会 减少 ， 当 启用 多 进程 后 结果 也 确实 如 此 。 然 而 ， 
我 们 预期 当 对 任意 数量 的 进程 使 用 细 粒 度 锁 时 系统 时 间 仍 然 会 保持 较 高 值 ， 因 为 使 用 细 粒 度 锁 会 
发 出 更 多 的 fcnt1 调用 。 如 果 将 图 20-6 中 的 fenti 调用 次 数 加 在 一 起 , 会 发 现 对 于 粗 粒度 锁 其 
平均 值 为 87858, 对 于 细 粒 度 锁 其 平均 值 为 115520。 基 于 此 , 我 们 认为 由 于 增加 了 31% 的 fcnt1 
调用 ， 所 以 会 增加 细 粒 度 锁 的 系统 时 间 。 然 而 ， 在 测试 中 加 细 粒 度 锁 的 两 个 进程 其 系统 时 间 减 少 
了 ， 超 过 两 个 进程 的 系统 时 间 只 有 小 幅 增 加 ， 这 让 人 困惑 。 

出 现 这 种 情况 有 两 个 原因 。 首 先 ， 图 20-7 显示 ， 当 没有 对 锁 进行 竞争 时 ， 粗 粒度 锁 和 细 粒 度 
锁 的 时 间 之 间 没 有 显著 的 差别 。 这 说 明 对 于 额外 的 £cntl 调用 所 引起 的 CPU 负载 并 没有 影响 测 
试 程序 的 性 能 。 其 次 ， 使 用 粗 粒度 锁 时 ， 持 有 锁 的 时 间 较 长 ， 这 也 就 增加 了 其 他 进程 因 等 待 该 锁 
而 陷入 阻塞 的 可 能 性 ， 而 使 用 细 粒 度 锁 时 ， 加 锁 的 时 间 较 短 ， 进 程 被 阻塞 的 可 能 性 就 降低 了 。 如 
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果 计算 fcnt1 的 阻塞 次 数 ， 会 发 现在 使 用 粗 粒度 锁 时 ， 进 程 阻 塞 频率 更 高 。 例 如 ， 当 有 4 个 进 
程 时 ， 使 用 粗 粒度 锁 的 阻塞 次 数 几乎 是 使 用 细 粒 度 锁 的 阻塞 次 数 的 5 倍 。 正 是 这 些 粗 粒度 锁 需 要 
休眠 和 唤醒 进程 的 额外 时 间 增 加 了 系统 时 间 ， 最 终 降 低 了 两 种 锁 的 系统 时 间 差 异 。 
最 后 一 列 〈 标 记 为 “人 A 系 统 ”)， 是 从 加 建议 性 细 粒 度 锁 到 加 强制 性 细 粒 度 锁 的 系统 CPU 
时 间 责 分 比 的 增 量 。 从 这 些 值 可 以 看 到 ， 随 着 并 发 数 的 增加 ， 强 制 性 锁 显 著 增加 了 系统 时 间 
(20%~76% )。 
由 于 所 有 这 些 测 试 的 用 户 代码 几乎 一 样 〈《 对 加 建议 性 细 粒 度 锁 和 强制 性 细 粒 度 锁 增 加 了 一 些 
font] 调用 )， 因 此 预期 对 每 一 行 的 用 户 CPU 时 间 应 基本 一 样 。 
当 我 们 第 一 次 运行 这 些 测试 时 ， 测 试 显示 对 于 多 进程 完成 锐 的 使 用 ， 其 粗 粒 度 锁 的 用 户 时 间 
几乎 是 细 粒 度 锁 的 两 倍 。 因 为 两 个 数据 库 版 本 是 相同 的 , 除了 调用 fcnt1l 的 次 数 不 同 ， 因 此 这 说 
| 不 通 。 在 调查 研究 之 后 ， 我 们 发 现 使 用 粗 粒 度 镇 时 会 有 更 多 的 竞争 ， 进 程 也 就 会 等 待 更 久 ， 操 作 
系统 于 是 就 决定 降低 CPU 时 钟 频率 来 节约 电量 。 在 使 用 细 粒 度 锁 时 ， 会 有 更 多 的 活动 ， 于 是 系统 
提高 了 CPU 时 钟 频率 。 这 使 得 使 用 粗 粒 度 锁 比 使 用 细 粒 度 锁 运行 得 慢 。 在 禁用 系统 频率 调整 特性 
|j 后， 我 们 的 测试 结果 就 没有 这 些 偏差 了 ， 用 户 时 间 的 差别 也 就 小 多 了 。 


785 20-8 的 第 一 行 与 图 20-7 中 的 nrec 取 2000 的 那 一 行 很 相似 。 这 与 预期 一 致 。 

图 20-9 是 图 20-8 中 加 建议 性 细 粒 度 锁 的 数据 图 。 我 们 绘制 了 进程 数 从 1 一 16 的 时 钟 时 间 ， 
也 绘制 了 用 户 CPU 时 间 除 以 进程 数 后 的 每 进程 用 户 CPU 时 间 , 另外 还 绘制 了 每 进程 系统 CPU 
时 间 。 

注意 ， 这 两 个 每 进程 CPU 时 间 都 是 线性 的 , 但 时 钟 时 间 是 非 线 性 的 。 可 能 的 原因 是 ， 当 进程 
数 增 大 时 ,操作 系统 用 于 进程 切换 的 CPU 时 间 增 多 。 操作 系统 的 开销 会 增加 时 钟 时 间 , 但 不 会 影 
喀 单 个 进程 的 CPU 时 间 。 

用 户 CPU 时 间 随 进程 数 增加 的 原因 可 能 是 因为 数据 库 中 有 了 更 多 的 记录 。 每 一 条 散 列 链 更 
i, BTEL db find and lock 函数 平均 要 运行 更 长 时 间 来 找到 一 条 记录 。 
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每 进程 系统 CPU 时 间 ， 


每 进程 系统 CPU 时 间 每 进程 用 户 CPU 时间 
时 钟 时 间 o ts) 
(s) 
30 
20 2 
i 每 进程 用 户 CPU 时 间 
Pod | 
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图 20-9 图 20-8 中 使 用 建议 性 细 粒 度 锁 的 数据 
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20.10 小结 


本 章 详 细 介绍 了 一 个 数据 库 函 数 库 的 设计 与 实现 。 考 虑 到 篇 幅 , 这 个 函数 库 尽 可 能 小 和 简单 ， 


但 也 包括 了 多 进程 并 发 访问 需要 的 对 记录 加 锁 的 功能 。 


此 外 ， 还 使 用 不 同 数量 的 进程 以 及 不 同 的 加 锁 方 法 ， 不 加 锁 、 建 议 性 锁 〈 细 粒度 锁 和 粗 粒 度 
锁 ) 和 强制 性 锁 ， 研 究 了 这 个 函数 库 的 性 能 。 可 以 看 到 加 建议 性 锁 比 不 加 锁 在 时 钟 时 间 上 增加 了 


29% 一 59%， 加 强制 性 锁 比 加 建议 性 锁 耗 时 再 增加 约 15%。 


习题 


20.1 


20.3 


20.4 
20.5 
20.6 


20.7 
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20.9 


f£ db dodelete 中 使 用 的 加 锁 是 比较 保守 的 。 例 如 ， 如 果 等 到 真正 要 用 空闲 链 表 时 再 加 
锁 ， 则 可 获得 更 大 的 并 发 性 。 如 果 将 调用 writew lock 移 到 调用 db writedat 和 _db 
_readptr 之 间 会 发 生 什 么 呢 ? 

mR db nextrec 不 对 空闲 链表 加 读 锁 而 被 读 的 记录 正在 被 删除 ， 描 述 在 怎样 的 情况 下 ， 
db nextrec 会 返回 正确 的 键 但 是 空 的 (不 正确 的 ) 数据 记录 。( 提 示 : 查看 ab 
 dodelete.) 

20.8 节 的 结尾 部 分 描述 了 _db_writeidx WI db writedat 的 加 锁 。 我 们 说 过 这 种 加 锁 
不 会 干涉 除了 调用 db_store 之 外 的 其 他 的 读 进 程 和 写 进程 。 如 果 改 为 强制 性 锁 ， 这 还 
成 立 吗 ? 

怎样 把 fsync 集成 到 这 个 数据 库 函 数 库 中 ? 

在 db store 中 ， 先 写 数据 记录 ， 然 后 再 写 索 引 记 录 。 如 果 将 顺序 颠倒 ， 会 发 生 什么 ? 
建立 一 个 新 的 数据 库 并 写 入 一 些 记录 。 写 一 个 程序 调用 do nextrec 来 读数 据 库 中 的 每 条 
记录 ， 并 调用 _db_hash 来 计算 每 条 记录 的 散 列 值 。 根 据 每 条 散 列 链 上 的 记录 数 画 出 直方 
Hl. db hash 中 的 散 列 函数 是 否 能 满足 需求 ? 

修改 数据 库 函 数 ， 使 得 索引 文件 中 散 列 链 的 数目 可 以 在 数据 库 建立 时 指定 。 

比较 两 种 情况 下 数据 库 函 数 的 性 能 : (a) 数据 库 与 测试 程序 在 同一 台 机 器 上 ; CO 数据 库 与 
测试 程序 在 不 同 的 机 器 上 ， 经 由 NFS 进行 访问 。 这 个 数据 库 函 数 库 提 供 的 记录 锁 机 制 还 能 
工作 吗 ? 

只 有 当 键 缓冲 区 和 数据 缓冲 区 与 其 所 需 的 大 小 精确 匹配 时 ， 数 据 库 才 会 返回 空闲 链表 记录 。 
请 修改 数据 库 以 使 空闲 链表 可 以 使 用 于 较 大 的 缓冲 区 来 满足 需求 。 应 该 如 何 更 改 数 据 库 的 
永久 格式 来 支持 这 种 特性 呢 ? 


20.10 在 实现 了 习题 20.9 的 方案 后 ， 编 写 一 个 工具 以 使 数据 库 格 式 可 以 从 一 种 转换 为 男 一 种 。 
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21.1 引言 


现在 我 们 开发 一 个 能 够 与 网 络 打印 机 通信 的 程序 。 这 些 打印 机 通过 以 太 网 与 多 个 计算 机 互 
联 ， 并 且 通 常 既 支 持 纯 文本 文件 也 支持 PostScript 文件 。 尽 管 一 些 应 用 程序 也 支持 其 他 通信 协议 ， 
但 一 般 使 用 网 络 打印 协议 CInternet Printing Protocol, IPP) 与 打印 机 通信 。 

我 们 将 描述 两 个 程序 ， 打 印 假 脱 机 守护 进程 〈print spooler daemon? 将 作业 发 送 到 打印 机 ， 命 令 行 
程序 将 打印 作业 提交 到 假 脱 机 守护 进程 。 因 为 假 脱 机 守护 进程 必须 处 理 很 多 操作 (与 客户 端 通信 来 提交 
作业 、 与 打印 机 通信 、 读 文件 、 扫 描 目 录 等 )， 这 就 提供 了 一 个 机 会 来 使 用 前 面 章节 所 提 到 的 函数 。 例 
如 ， 使 用 线程 (第 11 章 和 第 12 章 ) 来 简化 假 脱 机 守护 进程 的 设计 ， 使 用 套 接 字 〈 第 16 EO 在 调度 文 
件 打印 的 程序 和 打印 假 脱 机 守护 进程 之 间 遂 信 ， 也 可 以 在 打印 假 脱 机 守护 进程 与 网 络 打印 机 之 间 通 信 。 


21.2 网络 打印 协议 


网 络 打印 协议 CPP) 为 建立 基于 网 络 的 打印 系统 指定 了 通信 规则 。 通 过 将 一 个 IPP IRB BK 
入 到 带 网 卡 的 打印 机 中 ， 打 印 机 就 能 够 对 许多 计算 机 系统 的 请 求 加 以 服务 。 这 些 计算 机 系统 实际 
上 并 不 需要 在 同一 个 物理 网 络 中 。 因 为 PP 是 建立 在 标准 的 因特网 协议 上 的 ， 所 以 任何 一 台 能 够 

与 打印 机 建立 TCP/IP 连接 的 计算 机 都 能 向 打印 机 提交 打印 作业 。 

IPP 由 一 系列 IETF 标准 文档 (Requests For Comment, RFC) 说 明 ， 这 些 文档 可 以 在 
http://www.ietf. org/rfc.html 上 获得 。IEEE 相关 的 打印 机 工作 组 (Printer Working 
Group) 制定 的 标准 草案 也 可 以 在 http://www.pwg.org/ipp 上 获得 。 图 21-1 列 出 了 IPP 的 
主要 文档 ， 还 有 许多 其 他 文档 进一步 说 明了 过 程 管理 、 作 业 属 性 等 信息 。 









RFC 2567 IPP 设计 目标 

RFC 2568 IPP 模型 与 协议 架构 的 基本 原理 

RFC 2911 IPP/1.1: 模型 与 语义 

RFC 2910 IPP/1.1:; 编码 与 传输 

RFC 3196 IPP/1.1: 实现 者 指南 
21-1 基本 的 IPP 文档 


候选 标准 5100.12-2100 指明 实现 提供 的 所 有 功能 都 要 能 够 支持 符合 不 同 的 IPP 标准 版 本 。 有 
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许多 建议 性 的 IPP 协议 扩展 (具体 的 功能 在 IPP 相关 文档 中 定义 )。 将 这 些 功能 分 组 创建 出 不 同 的 
一 致 性 分 级 ; 每 一 级 是 一 个 不 同 的 协议 版 本 。 对 于 兼容 性 ， 每 个 更 高 的 一 致 性 级 别 要 符合 低 版 本 
定义 的 大 多 数 要 求 。 本 章 的 示例 中 使 用 的 是 IPP 1.1 版 本 。 

IPP 建立 在 超 文本 传输 协议 (Hypertext Transfer Protocol, HTTP) 之 上 (21.3 节 )。HTTP 又 
建立 在 TCP/IP 之 上 。IPP 报 文 的 结构 如 图 21-2 所 示 。 


以 太 网 Ip TCP HTTP IPP 


图 21-2 IPP 报 文 结构 

IPP 是 请 求 啊 应 协议 。 客户 端 发 送 请 求 到 服务 器 ， 服 务 器 用 响应 报 文 回答 这 个 请 求 。IPP 首部 
包含 一 个 域 来 指示 所 需 操 作 ， 这 些 操作 可 以 定义 成 提交 打印 作业 、 取 消 打 印 作 业 、 获 取 作 业 属 性 、 
获取 打印 机 属性 、 暂 停 和 重启 打印 机 、 挂 起 一 个 作业 和 霖 放 一 个 挂 起 的 作业 。 

21-3 显示 了 一 个 IPP 首部 的 结构 。 前 两 个 字 节 表示 IPP 版 本 号 ， 对 于 1.1 版 本 协议 ， 每 个 
字 节 的 值 是 1。 对 于 一 个 请 求 协议 ， 接 下 来 两 个 字 节 包含 一 个 值 来 指示 请 求 操作 的 类 型 。 对 于 一 
个 响应 协议 ， 这 两 个 字 节 包含 一 个 状态 码 。 
Q 字 节 ) 
(2 字 节 ) 


(4 E) 


(0-n 35) 





属性 结 来 标志 (17%) 
21-3 IPP 首部 结构 
接 下 来 4 字 节 包含 一 个 整数 以 标识 请 求 ， 使 得 请 求 和 响应 相 匹 配 。 接 着 是 可 选 的 属性 ， 然 后 
用 属性 结束 标志 终止 。 紧 接着 属性 结束 标志 之 后 是 任何 与 请 求 相 关联 的 数据 。 
在 首部 ， 整 数 以 有 符号 二 进 制 补 码 以 及 大 端 字 节 序 〈 即 网 络 字 节 序 ) 方式 存储 。 属 性 按照 组 
来 存储 。 每 个 组 都 以 标识 该 组 的 一 个 字 节 开始 。 在 每 一 个 组 中 ， 属 性 通常 表示 为 : 1 字 节 的 标志 ， 
然后 是 2 字 节 属性 名 长 度 ， 接 着 是 属性 名 ， 然 后 是 2 字 节 属性 值 长 度 ， 最 后 是 属性 值 本 身 。 属 性 
值 可 以 编码 成 字符 串 、 二 进 制 整数 或 者 更 为 复杂 的 结构 ， 如 日 期 /时 间 惟 。 
21-4 显示 了 attributes-charset 属性 是 如 何 编码 成 utf-8 类 型 的 值 的 。 
属性 标志 = 0x47 a 字 节 ) 
(2 字 节 ) 


(18 字 节 ) 


(2 字 节 ) 


Witii = utf-8 (5 FH) 





21-4 IPP 属性 编码 样 例 
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根据 所 请 求 的 操作 ， 一 些 属性 需要 在 请 求 报 文中 提供 ， 而 另 一 些 是 可 选 的 。 例如， 图 12-5 显 
示 了 用 于 为 打印 作业 请 求 定义 的 属性 。 


attributes-charset DA text Bk name 类 型 属性 所 使 用 的 字符 集 
attributes-natural-language 必需 text 或 name 类 型 属性 所 使 用 的 自然 语言 
printer-uri 5 打印 机 的 统一 资源 标识 符 

requesting-user-name i 提交 作业 的 用 户 名 如 果 可 以 ， 可 用 于 认证 ) 
job-name 选 用 于 区 别 多 个 作业 的 作业 名 
ipp-attribute-fidelity i 如 果 为 真 ， 告 诉 打 印 机 如 果 属 性 不 匹配 就 拒绝 作业 ， 否 


则 ， 打 印 机 尽 可 能 打印 作业 

document-name i 文档 名 《〈 如 适合 打印 一 个 旗 标 ) 

document-format i 文档 格式 〈 如 纯 文本 、PostScript) 

document-natural-language j 文档 的 自然 语言 

compression i 压缩 文档 的 算法 

job-k-octets i 以 1 024 字 节 单位 计算 的 文档 大 小 

job-impressions i fA PRAHA GRAZEN PRR) HAE 

job-media~sheets i 作业 打印 张 数 

图 21-5 打印 作业 请 求 的 属性 

IPP 首部 包含 了 文本 和 二 进 制 混合 数据 。 属 性 名 存储 为 文本 ， 而 数据 大 小 存储 为 二 进 制 整数 。 
这 使 得 构建 和 分 析 首 部 的 过 程 变 得 复杂 ， 因 为 需要 考虑 诸如 网 络 字 节 序 、 主 机 处 理 器 是 否 在 任意 
字 节 边界 编 址 对 齐 之 类 的 问题 。 一 个 较 好 的 可 选 方案 是 将 首部 设计 成 仅 包含 文本 。 这 样 以 稍微 脱 
胀 一 些 协 议 报 文 为 代价 简化 处 理 过 程 。 


21.3” 超 文本 传输 协议 HTTP 


HTTP V1.1 由 RFC 2616 说 明 。HTTP 也 是 请 求 响应 协议 。 请 求 报 文 包含 的 一 个 开始 行 ， 跟着 
是 首部 行 ， 接 着 是 空白 行 ， 然 后 是 一 个 可 选 的 实体 主体 。 在 我 们 这 种 情况， 实体 主体 包含 PPA 
部 和 数据 。 

HTTP 首部 是 ASCI 码 ， 每 行 以 回 车 (\r) 和 换行 符 (\n) 结束 。 开 始 行 包含 一 个 method 
来 指示 客户 端 请 求 的 操作 、 一 个 统一 资源 定位 符 (Uniform Resource Locator; URL) 来 描述 服 
务 器 和 协议 、 一 个 字符 串 来 表示 HTTP 版 本 。IPP 所 用 的 方法 仅 为 PoST， 用 于 将 数据 发 送 到 
服务 器 。 

首部 行 指定 属性 ， 如 实体 主体 的 格式 和 长 度 。 一 个 首部 行 包含 一 个 属性 名 ,后 紧 随 一 个 彤 号 ， 
接着 是 可 选 的 空格 符 ， 然 后 是 属性 值 ， 最 后 以 回 车 和 换行 符 结束 。 例 如 ， 为 了 指定 实体 主体 包含 
IPP 报 文 ， 应 包含 如 下 的 首部 行 ， 


Content-Type: application/ipp 
下 面 是 对 于 作者 使 用 的 Xerox Phaser 8560 打印 机 的 打印 请 求 的 HTTP 首部 样 例 。 


POST /ipp HTTP/1.1^M 
Content-Length: 21931^M 
Content-Type: application/ipp^M 
Host: phaser8560:631^M 

^M 





21.4 打印 假 脱 机 技术 643 


Content-Length 行 指明 了 HTTP 报 文中 数据 的 字 节 大 小 。 这 个 长 度 不 包含 了 HTTP 首部 的 大 
小 ， 但 包括 IPP 首部 的 大 小 。Host 行 指明 了 要 发 送 报 文 的 服务 器 主机 名 称 和 端口 号 。 

每 行 后 面 的 ^M 是 换行 符 前 的 回 车 符 。 换 行 符 不 能 被 显示 成 可 打印 字符 。 注意, 首部 的 最 后 一 
行 是 空 的 ， 只 有 回 车 和 换行 符 。 

HTTP 响应 报 文 的 起 始 行 包含 了 版 本 字符 串 ， 紧 接着 的 是 一 个 数字 状态 码 和 状态 信息 ， 最 后 
以 一 个 回 车 和 换行 结束 。HTTP 响应 报 文 的 剩余 部 分 和 请 求 报 文 的 格式 一 样 : 首部 之 后 是 一 个 空 
白 行 和 可 选 的 实体 主体 。 

打印 机 需要 发 送 给 我 们 如 下 的 报 文 作为 打印 请 求 的 回应 : 

HTTP/1.1 200 OR^M 

Content-Type: application/ipp^M 

Cache-Control: no-cache, no-store, must-revalidate^M 

Expires: THU, 26 OCT 1995 00:00:00 GMT^M 

Content-Lenqth: 215^M 

Server: Allegro-Software-RomPager/4.34^M 

^M 
对 于 打印 假 脱 机 守护 进程 ， 我 们 只 关心 报 文 的 第 一 行 ， 它 说 明了 请 求 成 功 或 者 用 数字 错误 码 以 及 
一 个 短 字 符 串 表示 请 求 失败 。 剩 下 的 报 文 包含 了 附加 信息 ， 可 以 通过 在 客户 端 和 服务 器 间 的 节点 
来 控制 缓存 以 及 表明 运行 在 服务 器 上 的 软件 版 本 号 。 
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本 章 中 我 们 开发 的 程序 是 一 个 基本 的 打印 假 脱 机 守护 进程 。 一 个 简单 的 用 户 命令 发 送 一 个 文 
件 到 打印 假 脱 机 守护 进程 ， 假 脱 机 守护 进程 将 其 保存 到 磁盘 ， 将 请 求 送 入 队列 ， 最 终 将 文件 发 送 
到 打印 机 。 

所 有 的 UNIX 系统 至 少 提供 一 个 打印 假 脱 机 系统 。FreeBSD 安装 的 是 BSD 的 打印 假 脱 机 
系统 LPD( 参 见 1pa(8)fll Stevens [1990] 第 13 3€). Linux 和 Mac OS X 包括 CUPS, 即 Common 
UNIX Printing System (参见 cupsd(8)). Solaris 提供 标准 的 System V 打印 假 脱 机 守护 进程 ( 参 
见 1p(1) 和 1psched(IM))。 在 本 章 中 ， 我 们 的 兴趣 不 在 于 这 些 假 脱 机 系统 本 身 ， 而 是 如 何 与 
网 络 打 印 机 通 依 。 我 们 需要 开发 一 个 假 脱 机 系统 能 够 解决 多 用 户 访问 单一 资源 〈 打 印 机 ) 
问题 。 

我 们 使 用 一 个 简单 的 命令 行程 序 读 取 一 个 文件 ， 将 其 送 到 打印 假 脱 机 守护 进程 。 这 个 命令 
行程 序 由 一 个 选项 来 强制 将 文件 按照 文本 来 处 理 〈 默 认 是 PostScript 文件 )。 这 个 命令 行程 序 是 
print. 

在 我 们 的 打印 假 脱 机 守护 进程 printa 中 ， 使 用 多 线程 将 任务 分 解 给 守护 进程 来 完成 。 

。 一 个 线程 在 套 接 字 上 监听 从 运行 print 的 客户 端 发 来 的 新 打印 请 求 。 

e 对 于 每 个 客户 端 产生 一 个 独立 的 线程 ， 将 要 打印 的 文件 复制 到 假 脱 机 区 域 。 

e 一 个 线程 与 打印 机 通信 ， 一 次 发 送 一 个 队列 中 的 作业 。 

。 一 个 线程 处 理 信和 号。 

21-6 显示 如 何 将 这 些 组 件 整 合 在 一 起 。 

打印 配置 文件 是 /etc/printer .conf。 这 个 文件 标识 了 运行 打印 假 脱 机 守护 进程 的 服务 器 
主机 名 和 网 络 打 印 机 的 主机 名 。 以 printserver 关键 字 开 始 的 行 标识 了 假 脱 机 守护 进程 。 以 
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printer 关键 字 开始 的 行 标识 了 打印 机 ， 空 格 符 之 后 跟着 打印 机 的 主机 名 。 





图 21-6 打印 假 脱 机 组 件 
一 个 打印 机 配置 文件 样 例 可 能 包含 下 列 行 : 


printserver fujin 
printer phaser8560 


其 中 fujin 是 运行 打印 假 脱 机 守护 进程 的 计算 机 系统 主机 名 ，phaser8560 是 网 络 打印 机 的 主 
机 名 。 我 们 假设 这 些 名 字 已 经 在 /etc/hosts 中 列 出 或 者 已 经 通过 正在 使 用 的 任意 服务 进行 了 注 
册 ， 这 样 我 们 就 可 以 将 这 些 名 字 转 换 成 网 络 地 址 。 
可 以 在 运行 打印 假 脱 机 守护 进程 的 同一 台 机 器 上 运行 print 命令 ， 也 可 以 在 同一 个 网 络 中 
的 任意 机 器 上 运行 它 。 我 们 只 需 配 置 在 /etc/printer.conf 中 的 printserver 字段 即 可 ， 
因为 只 有 守护 进程 需要 知道 打印 机 名 称 。 
安全 
拥有 超级 用 户 特 权 的 程序 可 能 让 计算 机 系统 受到 攻击 。 这 些 程序 通常 并 不 比 其 他 程序 更 脆 
弱 ， 但 是 被 攻破 时 将 导致 攻击 者 能 够 完全 访问 你 的 计算 机 系统 。 
本 章 中 的 打印 假 脱 机 守护 进程 拥有 超级 用 户 特权 , 在 这 个 例子 中 能 够 将 一 个 特权 TCP 端口 号 
绑 定 一 个 套 接 字 。 为 了 使 守护 进程 能 更 好 地 抵御 攻击 ， 我 们 可 以 : 
e 按照 最 少 特权 的 原则 (8.11 WO 设计 守护 进程 。 我 们 获得 一 个 绑 定 到 特权 端口 的 套 接 字 
之 后 ， 可 以 将 守护 进程 的 用 户 ID 和 组 的 ID 更 改 为 非 root Ct 1P)。 所 有 用 于 存储 队列 
中 打印 作业 的 文件 和 目录 的 拥有 者 应 该 是 非特 权 用 户 。 如 果 被 攻击 ， 这 种 情况 下 攻击 者 
只 能 通过 守护 进程 访问 打印 子 系统 。 虽 然 这 仍然 是 一 个 隐患 ， 但 是 比 起 攻击 者 可 以 完全 
访问 系统 ， 其 危害 性 已 大 大 降低 了 。 
。 审计 守护 进程 源 代码 中 所 有 已 知 的 潜在 脆弱 性 漏洞， 如 缓冲 区 溢出 。 
。 对 不 期 望 或 者 可 疑 的 行为 做 日 志 ， 这 样 可 以 引起 管理 员 注 意 并 进一步 调查 。 


21.5 源 代码 


本 章 的 源 代码 有 5 个 文件 ， 不 包括 在 前 面 章 节 中 所 用 的 一 些 公共 库 例 程 。 

ipp.h 包含 IPP 定义 的 头 文件 。 

print.h 包含 公用 的 常数 、 数 据 结构 定义 以 及 实用 工具 例 程 的 声明 的 头 文件 。 
util.c 用 于 两 个 程序 的 实用 工具 例 程 。 
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print.c 用 于 打印 文件 的 命令 行程 序 C 代码 。 
printd.c “用 于 打印 假 脱 机 守护 进程 的 C 代码 。 
我 们 按照 所 列 次 序 依次 分 析 每 个 文件 。 
首先 从 ipp.h 头 文 件 开始 。 
1 #ifndef _IPP_H 
2 #define _IPP_H 
3 /* 
4 * Defines parts of the IPP protocol between the scheduler 
5 * and the printer. Based on RFC2911 and RFC2910. 
6 */ 
7 /* 
8 * Status code classes. 
9 ui 
10  £define STATCLASS OK (x) ((x) >= 0x0000 && (x) <= OxOOff) 
11  &define STATCLASS INFO (x) ((x) >= 0x0100 && (x) <= OxO1ff) 
12 #define STATCLASS REDIR (x) ((x) >= 0x0300 && (x) <= OxOS3ff) 
13 #define STATCLASS CLIERR (x) ((x) >= 0x0400 && (x) <= OxOA4ff) 
14 #define STATCLASS, SRVERR (x) ((x) >= 0x0500 && (x) <= OxO5ff) 
15. /* 
16 * Status codes. 
17 */ 
18 #define STAT OK Ox0000 /* success */ 
19 #define STAT OK ATTRIGN  0x0001 /* OK; some attrs ignored */ 
20 #define STAT OK ATTRCON  0x0002 /* OK; some attrs conflicted */ 
21 #define STAT CLI BADREQ 0x0400 /* invalid client request */ 
22 #define STAT CLI FORBID  0x0401 /* request is forbidden */ 
23 #define STAT CLI NOAUTH  0x0402 /* authentication required */ 
24 #define STAT CLI NOPERM  0x0403 /* client not authorized */ 
25 #define STAT CLI NOTPOS  0x0404 /* request not possible */ 
26 #define STAT CLI TIMOUT  0x0405 /* client too slow */ 
27 #define STAT CLI NOTFND  0x0406 /* no object found for URI */ 
28 define STAT CLI OBJGONE 0x0407 /* object no longer available */ 
29 #define STAT CLI TOOBIG  0x0408 /* requested entity too big */ 
30 #define STAT CLI TOOLNG 0x0409 /* attribute value too large */ 
31 #define STAT CLI BADFMT 0x040a /* unsupported doc format */ 
32  4define STAT CLI NOTSUP  Ox040b /* attributes not supported */ 
33 #define STAT CLI NOSCHM 0x040c /* URI scheme not supported */ 
34 #define STAT CLI NOCHAR 0x040d /* charset not supported */ 
35 #define STAT CLI ATTRCON 0x040e /* attributes conflicted */ 
36 #define STAT CLI NOCOMP  0x040f /* compression not supported */ 
37 #define STAT CLI COMPERR 0x0410 /* data can't be decompressed */ 
38  4define STAT CLI FMTERR  Ox0411 /* document format error */ 
39 #define STAT CLI ACCERR 0x0412 /* error accessing data */ 
[17-14] — ipp.h 从 标准 的 #ifdef 开始 ,用 于 防止 同一 文件 被 包含 两 次 的 错误 。 然 后 定义 IPP 
状态 码 的 类 (参见 RFC 2911 的 第 13 节 )。 
[15—39] ”定义 基于 RFC 2911 的 状态 码 ， 但 是 本 程序 不 使 用 ， 这 些 状态 码 的 使 用 留 给 读者 作为 


练习 (参见 习题 21.1)。 


40 $define STAT SRV INTERN 


0x0500 /* unexpected internal error */ 


796 
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41 
42 
43 
44 
45 
46 
47 
48 
49 


50 
51 
52 
53 
54 
55 
56 
57 
58 
59 
60 
61 
62 
63 
64 
65 
66 
67 
68 


69 
70 
71 
72 
73 
74 
75 
76 


[40—49] 
[50~68] 


[69~76] 


71 
78 
79 
80 
81 
82 
83 
84 
85 


#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 


/* 


STAT SRV NOTSUP 
STAT SRV UNAVAIL 
STAT SRV BADVER 
STAT SRV DEVERR 
STAT SRV TMPERR 
STAT SRV REJECT 
STAT SRV TOOBUSY 
STAT SRV CANCEL 
STAT SRV NOMULTI 


* Operation IDs 


*/ 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 


ddefine 


#define 


/* 


OP PRINT JOB 
OP PRINT URI 

OP VALIDATE JOB 
OP CREATE, JOB 
OP SEND. DOC 

OP SEND URI 

OP CANCEL JOB 
OP GET JOB ATTR 
OP GET JOBS 


OP GET PRINTER ATTR 


OP HOLD JOB 

OP RELEASE JOB 
OP RESTART JOB 
OP PAUSE, PRINTER 


OP. RESUME, PRINTER 


OP. PURGE, JOBS 


* Attribute Tags. 


*/ 


#define TAG OPERATION ATTR 


#define 
#define 
#define 
#define 


TAG_JOB_ATTR 
TAG_END_OF_ATTR 
TAG_PRINTER_ATTR 
TAG_UNSUPP_ATTR 


0x0501 
0x0502 
0x0503 
0x0504 
0x0505 
0x0506 
0x0507 
0x0508 
0x0509 


/* 
/* 
/* 
/* 
/* 
/* 
/* 
/* 
/* 


0x02 
0x03 
0x04 
0x05 
0x06 
0x07 
0x08 
0x09 
Ox0a 


Ox0b 


OxOc 
OxOd 
OxOe 
0x10 
0x11 
0x12 


0x01 
0x02 
0x03 
0x04 
0x05 


节 描 述 了 所 有 的 状态 码 。 


/* 


* Value Tags. 


xf 
#define 
#define 
#define 
#define 
#define 
#define 


TAG_UNSUPPORTED 
TAG_UNKNOWN 
TAG_NONE 
TAG_INTEGER 

TAG BOOLEAN 
TAG_ENUM 


0x10 
0x12 
0x13 
0x21 
0x22 
0x23 


operation not supported */ 
service unavailable */ 
version not supported */ 
device error */ 

temporary error */ 

server not accepting jobs */ 
server too busy */ 

job has been canceled */ 
multi-doc jobs unsupported */ 


/* operation attributes tag */ 
/* job attributes tag */ 

/* end of attributes tag */ 

/* printer attributes tag */ 

/* unsupported attributes tag */ 


Bee fe ORAS. 0x500-—-0x5ff 是 服务 器 错误 码 。RFC 2911 中 13.1.1 528 13.1.5 


接着 定义 各 种 操作 ID。IPP 中 定义 的 每 个 操作 有 一 个 ID( 参 见 RFC 2911 BB 4.4.15 节 )。 
在 本 例 中 ， 仅 用 到 打印 作业 操作 。 
属性 标志 限定 了 IPP 中 请 求 和 响应 报 文 的 属性 组 。 这 些 值 定义 在 RFC 2910 的 3.5.1 节 。 


/* 
/* 
/* 
/* 
/* 
/* 


unsupported value */ 
unknown value */ 

no value */ 

integer */ 

boolean */ 
enumeration */ 
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86 #define TAG OCTSTR 0x30 /* octetString */ 

87 #define TAG DATETIME Ox31 /* dateTime */ 

88 #define TAG RESOLUTION 0x32 /* resolution */ 

89 #define TAG INTRANGE 0x33 /* rangeOfInteger */ 

90 #define TAG TEXTWLANG 0x35 /* textWithLanguage */ 

91 #define TAG NAMEWLANG 0x36 /* nameWithLanguage */ 

92 #define TAG TEXTWOLANG 0x41 /* textWithoutLanguage */ 
93 #define TAG NAMEWOLANG 0x42 /* nameWithoutLanguage */ 
94 #define TAG KEYWORD 0x44 /* keyword */ 

95 #define TAG URI 0x45 /* URI */ 

96 #define TAG URISCHEME 0x46 /* uriScheme */ 

97 #define TAG CHARSET 0x47 /* charset */ 

98 #define TAG NATULANG 0x48 /* naturalLanguage */ 

99 #define TAG MIMETYPE 0x49 /* mimeMediaType */ 


100 struct ipp hdr { 


101 int8 t major version: /* always 1 */ 

102 int8 t minor version; /* always 1 */ 

103 union ( 

104 intl6 t op; /* operation ID */ 

105 intl6 t st; /* status */ 

106 ) u; 

107 int32 t request id; /* request ID */ 

108 char attr group[i]; /* start of optional attributes group */ 
109 /* optional data follows */ 

110 ); 


111 #define operation u.op 
112 #define status u.st 


113 #endif /* _IPP_H */ 
[7799] 值 标志 指示 每 个 属性 和 参数 的 格式 ， 由 RFC 2910 的 3.5.2 节 定 义 。 
[100—113] ”定义 IPP 首部 的 结构 。 请 求 报 文 与 响应 报 文 的 首部 一 样 ， 除 了 请 求 中 的 操作 ID 被 
响应 中 的 状态 码 代 蔡 。 
在 头 文件 尾部 我 们 用 #endif 来 匹配 文件 开始 的 #ifdef。 
下 一 个 文件 是 print.h 3X xf. 


1 #ifndef PRINT H 
#define , PRINT H 





3 /* 

4 * Print server header file. 
5 */ 

6 #include <sys/socket.h> 

7 #include <arpa/inet.h> 

8 #include <netdb.h> 
9 #include <errno.h> 


10 #define CONFIG FILE "/etc/printer.conf" 
11 #define SPOOLDIR "/var/spool/printer" 
12 #define JOBFILE "jobno" 

13 #define DATADIR "data" 


14 #define REQDIR "reqs" 
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15 #if defined(BSD) 

16 #define LPNAME "daemon" 
17 #elif defined (MACOS) 

18 #define LPNAME "^ lp" 

19 #else 

20 #define LPNAME "lp" 

21 #endif 

[17-9] 在 这 个 头 文件 中 包含 所 需要 的 所 有 头 文件 。 应 用 程序 只 需 简单 地 包含 print.h, 而 
不 需要 跟踪 所 有 的 头 文件 依赖 关系 。 

[10—14] ”定义 实现 所 需 的 文件 和 目录 。 包 含 打印 守护 进程 和 网 络 打 印 机 主机 名 的 配置 文件 在 
/etc/printer.conf 中 。 需 要 打印 的 文件 副本 在 目录 /var/spool/printer/ 
data 中 ; 对 于 每 个 请 求 的 控制 信息 在 目录 /var/spool/printer/reqs 中 。 包含 
下 一 个 作业 编号 的 文件 是 /var/spool/printer/jobno。 
目录 必须 由 管理 员 创建 并 且 由 运行 打印 守护 进程 的 账户 所 有 。 如 果 这 些 目录 不 存在 ， 
守护 进程 也 不 会 创建 这 些 目录 ， 因 为 守护 进程 需要 root 权限 来 创建 /var/spool 
中 的 目录 。 我 们 的 设计 初衷 是 当 以 root 权限 运行 时 , 尽量 让 守护 进程 少 做 一 些 事情 ， 
以 减少 产生 安全 漏洞 的 可 能 。 

[15—21] ”接着 定义 运行 打印 守护 进程 的 账户 名 。 在 Linux 和 Solaris 中 ， 这 个 账户 名 是 1p。 在 
Mac OS X 中 ， 账 户 名 是 _1p。FreeBSD 没有 为 打印 守护 进程 定义 单独 的 账户 ， 所 以 
我 们 使 用 为 系统 守护 进程 保留 的 账户 。 

22 #define FILENMSZ 64 

23 #define FILEPERM (S_IRUSR|S_IWUSR) 

24 define USERNM MAX 64 

25 #define JOBNM_MAX 256 

26 #define MSGLEN_MAX 512 

27 #ifndef HOST NAME MAX 

28 #define HOST NAME MAX 256 

29 tendif 

30 #define IPP PORT 631 

31 #define QLEN 10 

32 #define IBUFSZ 512  /* IPP header buffer size */ 

33 #define HBUFSZ 512  /* HTTP header buffer size */ 

34 #define IOBUFSZ 8192 /* data buffer size */ 

35 #ifndef ETIME 

36 #define ETIME ETIMEDOUT 

37 #endif 

38 extern int getaddrlist(const char *, const char *, 

39 struct addrinfo **); 

40 extern char *get printserver(void); 

41 extern struct addrinfo *get printaddr(void); 

42 extern ssize t tread(int, void *, size t, unsigned int); 

43 extern ssize t treadn(int, void *, size t, unsigned int); 

44 extern int connect retry(int, int, int, const struct sockaddr *, 
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45 socklen t); 
46 extern int initserver(int, const struct sockaddr *, socklen t, 
47 int); 


[22~34] 


[35~37] 


接 下 来 定义 限制 和 常量 。FILEPERM 是 创建 要 打印 的 文件 副本 使 用 的 权限 。 这 个 权限 
是 被 限制 的 ， 因 为 我 们 不 希望 普通 用 户 在 等 待 打印 时 能 够 读 取 他 人 的 文件 。 我 们 定义 
HOST NAME MAX 作为 用 sysconf 不 能 够 确定 系统 的 限制 时 能 够 支持 的 最 大 的 主机 名 。 
IPP 被 定义 为 使 用 端口 631。QLEN 是 传递 给 listen 的 backlog 参数 (具体 细节 见 16.4 节 )。 
一 些 平台 没有 定义 错误 码 ETIME, 因此 另外 定义 一 个 错误 码 , 使 得 在 这 些 系 统 上 有 意 
义 。 当 读 超 时 时 ， 返 回 这 个 错误 码 (我 们 不 希望 在 从 套 接 字 读 的 时 候 服务 器 无 限期 地 
阻塞 )。 


[38—47] ”接着 , 定义 所 有 包含 在 util.c 中 的 公共 例 程 ( 稍 后 将 分 析 这 些 例 程 )。 注 意 , 图 16-11 
中 的 connect retry 函数 和 图 16-22 中 的 initserver 函数 没有 包含 在 util.c 中。 

48 /* 

49 * Structure describing a print request. 

50 7 

51 struct printreq { 

52 uint32 t size; /* size in bytes */ 

53 uint32 t flags; /* see below */ 

54 char usernm[USERNM MAX]; /* user's name */ 

55 char jobnm[JOBNM MAX]; /* job's name */ 

56 ); 

57 /* 


58 * Request flags. 


59  */ 


60 #define PR TEXT 0x01 /* treat file as plain text */ 
61 /* 

62  * The response from the spooling daemon to the print command. 

63  */ 

64 struct printresp ( 

65 uint32 t retcode; /* O=success, !Ü-error code */ 
66 uint32 t jobid; /* job ID */ 

67 char msg[MSGLEN MAX]; /* error message */ 

68 p 


69 #endif /* PRINT H */ 


[48-69] 


printreq 结构 和 printresp 结构 定义 了 Print 程序 和 打印 假 脱 机 守护 进程 之 间 
的 协议 。print 程序 发 送 printreq 结构 到 打印 假 脱 机 守护 进程 ， 该 结构 定义 了 作 
业 大 小 (以 字 节 为 单位 )、 作 业 性 质 、 用 户 名 和 作业 名 。 打 印 假 脱 机 守护 进程 用 
printresp 结构 回应 ， 该 结构 包括 返回 码 、 作 业 ID 和 错误 消息 〈 如 果 请 求 失败 )。 
PR TEXT 作业 性 质 表 明 要 打印 的 文件 只 能 被 视 为 纯 文 本 《而 不 是 PostScript)。 我 们 为 
所 有 的 标志 定义 一 个 掩 码 而 非 对 每 个 标志 定义 一 个 独立 的 字段 。 尽 管 目 前 只 定义 了 一 
个 标志 值 ， 将 来 还 可 以 增加 更 多 性 质 来 扩展 这 个 协议 。 例 如 ， 我 们 可 以 在 增加 一 个 标 
志 位 用 来 请 求 双 面 打印 。 不 需要 改变 结构 的 大 小 就 可 以 有 31 个 额外 的 标志 位 的 空间 。 
改变 结构 的 大 小 意味 着 可 能 会 引入 客户 端 和 服务 器 的 兼容 性 问题 ， 除 非 对 两 边 同 时 更 
新 。 另 一 个 可 选 方案 就 是 增加 一 个 报 文 版 本 号 ， 以 允许 不 同 版 本 的 结构 有 所 改变 。 
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注意 ， 对 协议 结构 中 的 所 有 整数 显 式 地 定义 了 一 个 长 度 ， 这 可 以 在 客户 端 与 服务 器 
801 的 整数 长 度 不 同时 避免 错位 的 结构 元 素 。 
下 一 个 文件 我 们 考察 util.c， 该 文件 包含 实用 工具 例 程 。 


#include "apue.h" 
#include "print.h" 
#include <ctype.h> 
#Hinclude <sys/select.h> 


A WM He 


#define MAXCFGLINE 512 
#define MAXKWLEN 16 
7 #define MAXFMTLEN 16 


nA uU 


8 /* 

9 * Get the address list for the given host and service and 
10 * return through ailistpp. Returns 0 on success or an error 
11 * code on failure. Note that we do not set errno if we 
12 * encounter an error. 

13 c 

14 * LOCKING: none. 
15 */ 

16 int 


17 getaddrlist(const char *host, const char *service, 
18 struct addrinfo **ailistpp) 


19 { 

20 int err; 

21 struct addrinfo hint; 

22 hint.ai flags - AI CANONNAME; 
23 hint.ai family - AF INET; 

24 hint.ai socktype - SOCK STREAM; 


25 hint.ai protocol - 0; 
26 hint.ai addrlen = 0; 
27 hint.ai canonname - NULL; 
28 hint.ai addr = NULL; 
29 hint.ai next - NULL; 


30 err = getaddrinfo(host, service, &hint, ailistpp); 
31 return(err); 
32 } 


[17] ”首先 定义 了 这 个 文件 中 函数 中 的 限制 。MAXCFGLINE 是 打印 机 配置 文件 的 行 的 最 大 长 
BE. MAXKWLEN 是 配置 文件 中 关键 字 的 最 大 长 度 、MAXFMTLEN 是 传 给 sscanf NH 
式 化 字符 串 的 最 大 长 度 。 
[832] ”第 一 个 函数 是 getaddrlist， Æ getaddrinfo (16.3.3 $) 的 封装 ， 因 为 我 们 常常 
用 同样 的 结构 来 调用 getaddrinfo。 注 意 ， 在 这 个 函数 中 不 需要 互 斥 锁 。 每 个 函数 
前 面 的 LOCKING 注释 是 用 于 多 线程 锁定 的 文档 编写 。 这 一 注释 列 出 了 可 能 的 关于 锁 
[802 | KBR. SARA BERERERHNA, JE TUR FH IX RA AEA BL. 


a3: f= 

34  * Given a keyword, scan the configuration file for a match 
35 * and return the string value corresponding to the keyword. 
36 * 

37  * LOCKING: none. 
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38  */ 
39 static char * 
40 scan configfile(char *keyword) 


41 | 

42 int n, match; 

43 FILE *fp:; 

44 char keybuf[MAXKWLEN], pattern[MAXFMTLEN]; 
45 char line[MAXCFGLINE]; 


46 static char valbuf [MAXCFGLINE]: 


47 if ((fp = fopen(CONFIG FILE, "r")) -- NULL) 

48 log sys("can't open $s", CONFIG FILE); 

49 sprintf (pattern, "%%%ds %$%$ds", MAXKWLEN-1, MAXCFGLINE-1); 
50 match = 0; 

51 while (fgets(line, MAXCFGLINE, fp) != NULL) { 

52 n = sscanf(line, pattern, keybuf, valbuf); 

53 if (n == 2 && strcmp(keyword, keybuf) == 0) { 
54 match = 1; 

55 break; 

56 } 

57 } 

58 fclose (fp); 

59 if (match != 0) 

60 return (valbuf) ; 

61 else 

62 return (NULL) ; 

63 } 


[33~46] scan_configfile 函数 搜索 打印 机 配置 文件 中 指定 的 关键 字 。 

[47 一 63] ”以 读 方 式 打 开 配 置 文件 ， 根 据 搜 索 模 式 建 立 格式 字符 串 。 符 号 $8%%ds 建立 一 个 格式 
指示 器 来 限定 字符 串 长 度 ， 这 样 在 栈 中 存放 字符 串 的 缓冲 区 就 不 会 溢出 。 在 文件 中 一 次 
读 取 一 行 ， 并 且 扫 描 被 空格 符 分 开 的 两 个 字符 串 ， 如 果 找 到 它们 ， 就 用 关键 字 与 第 一 个 
字符 串 比 较 。 如 果 拷 到 一 个 匹配 或 者 读 到 文件 尾 ， 则 循环 结束 并 关闭 文件 。 如 果 关 键 字 
匹配 ， 则 返回 一 个 指向 包含 关键 字 后 面 的 字符 串 的 缓冲 区 的 指针 ， 和 否则 返回 NULL. 
返回 的 字符 串 存放 在 静态 缓冲 区 (valbuf) 中 ， 该 缓冲 区 会 被 紧 接 的 调用 覆盖 。 因 
it, scan configfile 不 能 用 于 多 线程 程序 ， 除 非 能 够 小 心地 避免 同时 有 多 个 线 
程 调用 它 。 


64 /* 

65  * Return the host name running the print server or NULL on error. 
66 * 

67 * LOCKING: none. 

68  */ 

69 char * 

70 get printserver(void) 

71 d 

72 return(scan configfile("printserver")); 

73 } 


74  /* 

75  * Return the address of the network printer or NULL on error. 
76 ^f 

T] * LOCKING: none. 
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78 */ 

79 struct addrinfo * 

80 get printaddr(void) 

81 í 

82 int err; 

83 char *p; 

84 struct addrinfo *ailist; 

85 if ((p = scan configfile("printer")) != NULL) { 

86 if ((err = getaddrlist(p, "ipp", &ailist)) != 0) { 

87 log msgí("no address information for $s", p): 

88 return (NULL) ; 

89 ) 

90 returní(ailist); 

91 } 

92 log msg("no printer address specified"); 

93 return (NULL): 

94 ) 

[64—73] get printserver 仅仅 是 一 个 简单 的 函数 封装 函数 ， 它 通过 调用 scan configfile 
找到 运行 打印 假 脱 机 守护 进程 的 计算 机 系统 名 。 

[74—94] 使 用 get printaddr 函数 找到 网 络 打印 机 的 地 址 。 除 了 通过 配置 文件 中 的 打印 机 
名 找到 相应 的 网 络 地 址 之 外 ， 该 函数 与 前 面 的 函数 类 似 。 
get printserver 和 get_printaddr 均 调 用 scan_configfile。 如 果 不 能 打 
开打 印 机 配置 文件 ，scan_configfile 就 调用 1og_sys 打印 出 错 消 息 并 退出 。 尽 
管 get printserver 由 客户 端 命令 调用 ，get_printaddr 由 守护 进程 程序 调用 ， 
但 两 者 均 可 调用 log_sys， 因 为 通过 设置 一 个 全 局 变量 可 以 安排 日 志 函 数 将 其 打印 
到 标准 错误 ， 而 不 是 输出 到 日 志文 件 。 

95 /* 

96 * "Timed" read - timout specifies the # of seconds to wait before 

97 * giving up (5th argument to select controls how long to wait for 

98  * data to be readable). Returns # of bytes read or -1 on error. 

99 

100 * LOCKING: none. 

101 */ 

102 ssize t 

103 tread(int fd, void *buf, size t nbytes, unsigned int timout) 

104 | 

105 int nfds; 

106 fd set readfds; 

107 struct timeval tv; 

108 tv.tv sec - timout; 

109 tv.tv usec - 0; 

110 FD ZERO (&readfds); 

111 FD SET(fd, &readfds); 

112 nfds - select(fd*1, &readfds, NULL, NULL, &tv); 

113 if (nfds <= 0) { 

114 if (nfds == 0) 

115 errno - ETIME; 

116 return(-1); 


117 


118 
119 


(95~107] tread 的 函数 读 取 指 定 的 字 节 数 ， 在 放弃 以 前 至 多 阻塞 timout 秒 。 当 我 们 从 一 个 
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return(read(fd, buf, nbytes)); 


J 


套 接 字 或 一 个 管道 读数 据 时 这 个 函数 很 有 用 。 如 果 在 指定 的 时 间 期 限 内 没有 接收 数 
据 ， 返 回 -1 并 将 errno RA ETIME。 如 果 在 时 间 期 限 内 有 数据 可 用 ， 返 回 最 多 
nbytes 字 节 的 数据 , 但 是 如 果 数 据 没 有 及 时 到 达 , 我 们 可 以 返回 比 要 求 的 少 的 数据 。 
我 们 用 tread 在 打印 假 脱 机 守护 进程 上 防止 拒绝 服务 攻击 。 一 个 恶意 用 户 可 能 重 
BARRERA TP MAMA RABE, 只 是 为 了 阻止 其 他 用 户 提 交 打 印 作 业 。 通过 
一 个 合理 时 间 内 放弃 的 方式 , 我 们 防止 这 种 情况 发 生 。 其 巧妙 之 处 在 于 选择 一 个 合 
理 的 超时 值 ， 当 系统 负载 比较 低 和 任务 花费 更 长 时 间 时 , 该 值 足够 大 能 够 防止 过 早 
天 折 。 如 果 我 们 选择 的 值 太 大 , 通过 允许 守护 进程 程序 消耗 太 多 资源 去 处 理 挂 起 请 
求 ， 可 能 导致 拒绝 服务 攻击 。 


[108—119] “使 用 select 等 待 指定 的 文件 描述 符 可 读 。 如 果 在 要 读 取 的 数据 可 用 之 前 超时 ， 


select 返回 0， 这 种 情况 将 errno 设 为 ETIME。 如 果 select 失败 或 超时 ， 返 
回 -1， 否 则 返回 任何 可 用 数据 。 


120 /* 

121 * "Timed" read - timout specifies the number of seconds to wait 
122 * per read call before giving up, but read exactly nbytes bytes. 
123  * Returns number of bytes read or -1 on error. 

124 * 

125 * LOCKING: none. 

126* */ 

127 ssizet 

128 treadn(int fd, void *buf, size t nbytes, unsigned int timout) 
129 { 

130 size t nleft; 

131 ssize t nread; 

132 nleft - nbytes; 

133 while (nleft > 0) ( 

134 if ((nread = tread(fd, buf, nleft, timout)) < 0) { 

135 if (nleft == nbytes) 

136 returní-1); /* error, return -1 */ 

137 else 

138 break; /* error, return amount read so far */ 
139 } else if (nread == 0) { 

140 break; /* EOF */ 

141 } 

142 nleft -= nread; 

143 buf += nread; 

144 } 

145 return(nbytes - nleft); /* return >= 0 */ 

146 } 


[120—146] HHT tread 的 变 体 treadn， 它 仅 读 取 指定 的 字 节 数 。 这 和 14.7 节 中 描述 的 


readn 类 似 ， 但 是 附加 了 一 个 超时 参数 。 

为 了 正好 读 取 nbytes 字 节 ， 必 须 进 行 多 次 read WA. 其 困难 之 处 在 于 尝试 将 单个 
超时 值 应 用 到 多 个 read 调用 。 这 里 不 想 用 闹钟 ， 因 为 在 多 线程 应 用 中 信号 会 变 乱 ; 
也 不 能 依赖 系统 根据 select 的 返回 更 新 timeval 结构 ， 以 指示 剩余 的 时 间 ， 因 为 
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许多 平台 不 支持 这 个 〈14.5.1 节 )。 因 此 ， 这 种 情况 需要 折 中 并 定义 一 个 超时 值 应 用 到 
单独 的 read 调用 。 它 限制 循环 中 每 次 迭代 的 等 待 时 间 ， 而 不 是 限制 总 的 等 待 时 间 。 
总 等 待 的 最 大 时 间 由 nbytes X timou 秒 限 定 〈 最 坏 情况 下 ， 一 次 仅 接收 一 个 字 节 )。 
用 nleft 记录 要 读 取 的 剩余 字 节 数 。 如 果 tread 失败 并 在 上 一 个 迭代 中 已 经 接 
收 到 数据 ， 则 停止 while 循环 并 返回 读 取 的 字 节 数 ， 否 则 返回 一 1。 

接 下 来 是 用 于 提交 打印 作业 的 命令 程序 。C 源 代码 文件 是 print.c。 


/* 

* The client command for printing documents. Opens the file 
* and sends it to the printer spooling daemon. Usage: 

* print [-t] filename 

wf 

#include "apue.h" 

#include "print.h" 

#include <fcntl.h> 

#include <pwd.h> 


/* 

* Needed for logging funtions. 
7 

int log to stderr = 1; 


void submit file(int, int, const char *, size t, int); 


int 
main(int argc, char *argv[]) 
{ 


int fd, sockfd, err, text, c; 
struct stat sbuf; 
char *host; 


struct addrinfo ‘*ailist, *aip; 


err = 0; 
text = 0; 
while ((c = getopt(argc, argv, "t")) !- -1) 1 
switch (c) { 
case 't': 
text = 1; 
break; 


case '?'; 
err = 1; 
break; 
} 
} 


[1 一 14] ”需要 定义 一 个 log_to_stderr 整数 ， 通 过 这 个 整数 能 够 使 用 库 中 的 日 志 函 数 。 如 


果 该 整数 设 为 非 0 值 ， 错 误 消 息 将 被 送 到 一 个 标准 错误 流 而 非 日 志文 件 中 。 尽 管 在 
print.c 中 没有 使 用 任何 日 志 函 数 ， 但 将 util.o 链接 到 print.o 构建 了 一 个 可 
执行 的 print 命令 ， 并 且 util.c 包含 用 于 用 户 命令 行程 序 和 守护 进程 的 函数 。 


[15—33] ”支持 一 个 选项 , 即 -t, 强行 使 文件 按照 文本 格式 打印 (而 不 是 其 他 格式 , 如 PostScript 


格式 )。 使 用 getopt 函数 来 处 理 命令 选项 。 
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34 if (err || (optind != argc - 1)) 

35 err quit("usage: print [-t] filename"); 

36 if ((fd = open(argv[optind], O RDONLY)) < 0) 

37 err sys("print: can't open $s", argv[optind]); 

38 if (fstat(fd, &sbuf) < 0) 

39 err sys("print: can't stat $s", argv[optind]); 

40 if (!S ISREG(sbuf.st mode)) 

41 err quit("print: %s must be a regular file\n", argv[optind]):; 

42 /* 

43 * Get the hostname of the host acting as the print server. 

44 */ 

45 if ((host = get printserver()) == NULL) 

46 err quit("print: no print server defined"); 

47 if ((err = getaddrlist(host, "print", &ailist)) !- 0) 

48 err quit("print: getaddrinfo error: $s", gai strerror(err)): 

49 for (aip = ailist; aip != NULL; aip = aip-»ai next) { 

50 if ((sfd = connect retry(AF INET, SOCK STREAM, 0, 

51 aip-»ai addr, aip-»ai addrlen)) < 6) { 

52 err - errno; 

[4—41] 4 getopt 处 理 完 命令 选项 ， 将 变量 optind 设 为 指向 第 一 个 非 选 项 参数 的 下 标 。 
如 果 这 是 一 个 值 而 非 最 后 一 个 参数 的 下 标 , 那么 说 明 它 是 错误 的 参数 个 数 (只 支持 一 
个 非 选 项 参数 )。 错 误 处 理 包 括 : 检查 是 否 能 够 打开 要 打印 的 文件 ， 检查 是 否 是 一 个 
常规 文件 〈 而 不 是 一 个 目录 或 者 其 他 类 型 的 文件 )。 

[42 一 48] ”通过 调用 util.c 中 的 get_printserver 函数 取得 打印 假 脱 机 守护 进程 和 名， 并且 
调用 getaddrlist (也 在 util.c 中 ) 将 主机 名 转换 成 一 个 网 络 地址。 
注意 ， 指 定 服务 名 为 “print”。 在 系统 上 安装 打印 假 脱 机 守护 进程 时 ， 需 要 确保 
/etc/services (或 等 价 的 数据 库 ) 有 打印 机 服务 的 条 目 。 当 为 守护 进程 选择 一 个 
端口 时 ， 最 好 选择 特权 端口 ， 以 防止 恶意 用 户 程序 假装 成 一 个 打印 假 脱 机 守护 进程 ， 
而 实际 上 是 要 偷 取 打印 文件 的 副本 。 这 意味 着 端口 号 应 小 于 1024 (回忆 16.3.4 节 )， 
并 且 守 护 进 程 运行 时 必须 具有 超级 用 户 特权 以 便 能 够 绑 定 一 个 保留 端口 。 

[49~52] ”使 用 getaddrinfo 返回 的 地 址 列表 来 尝试 连接 到 守护 进程 ,然后 使 用 能 够 连接 的 第 
一 个 地 址 发 送 文件 到 守护 进程 。 

53 ) else ( 

54 submit file(fd, sfd, argv[optind], sbuf.st size, text); 

55 exit (0); 

56 } 

57 } 

58 err_exit(err, "print: can’t contact %s", host); 

53} 

60  /* 

61 * Send a file to the printer daemon. 

62 */ 

63 void 

64 submit file(int fd, int sockfd, const char *fname, size t nbytes, 

65 int text) 

66 

67 int nr, nw, len; 

68 struct passwd *pwd; 

69 struct printreq req; 


809 
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71 


72 
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struct printresp res; 


char bu£[IOBUFSZ]; 
/* 

* First build the header. 

*/ 


if ((pwd = getpwuid(geteuid())) == NULL) ( 
strcpy(req.usernm, "unknown"); 

) else ( 
strncpy(req.usernm, pwd-»pw name, USERNM MAX-1); 
req.usernm[USERNM MAX-1) = ’\0'; 

} 


[53—59] ”如 果 能 够 连接 到 打印 假 脱 机 守护 进程 , 则 调用 submit file 将 要 打印 的 文件 传送 到 


守护 进程 ， 然 后 用 返回 值 0 表示 成 功 后 退出 。 如 果 不 能 连接 到 任何 地 址 ， 那么 就 调用 
err exit 来 打印 错误 消息 并 且 返 回 1 表示 失败 后 退出 (附录 BAST err_exit 
的 源 代码 和 其 他 错误 例 程 )。 


[60—80] ^ submit file 发 送 打 印 机 请 求 到 守护 进程 并 读 取 响 应 消息 。 首先 , 建立 printreq 


81 


82 
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85 


86 
87 
88 
89 
90 
91 
92 
93 
94 
95 


96 
97 
98 
99 
i00 
101 
102 
103 
104 
105 
106 


请 求 头 。 使 用 geteuid 来 获得 调用 者 的 有 效用 户 ID 并 将 其 传 给 getpwuid WER 
找 在 系统 口令 文件 中 的 用 户 。 将 该 用 户 名 复制 到 请 求 头 。 如 果 不 能 识别 用 户 , 在 请 求 
首部 中 使 用 字符 串 "runknown"。 从 口令 文件 中 复制 用 户 名 时 ， 为 避免 写 超出 请 求 首 
部 的 用 户 名 缓冲 区 ,可 以 使 用 strncpy。 如 果 用 户 名 比 缓冲 区 长 ，strncpy 不 会 在 
缓冲 区 中 存储 终止 null 字 节 ， 因 此 我 们 需要 自己 来 做 。 


req.size = htonl(nbytes); 


if (text) 

req.flags - htonl(PR TEXT); 
else 

req.flags = 0; 


if ((len = strlen(fname)) >= JOBNM MAX) | 
/* 
* Truncate the filename (+-5 accounts for the leading 
* four characters and the terminating null). 
+7 
strcpy(req.jobnm, "... "); 
strncat(req.jobnm, &fname[len-JOBNM MAX-*5], JOBNM MAX-5); 
} else { 
strcpy(req.jobnm, fname); 
} 


/* 
* Send the header to the server. 
*/ 
nw = writen(sockfd, &req, sizeof (struct printreq)); 
if (nw != sizeof (struct printreq)) 1 
if (nw < 0) 
err sys("can't write to print server"); 
else 
err quit("short write (%d/%d) to print server", 
nw, sizeof{struct printreq)); 
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[81-95] ”将 要 打印 的 文件 转 成 网 络 字 节 序 后 ， 将 其 文件 长 度 保存 在 请 求 首部 。 如 果 文 件 按 纯 
文本 格式 打印 ,在 请 求 首部 保存 PR. TEXT 标志 .通过 将 这 些 整 数 转化 成 网 络 字 节 序 ， 
可 以 在 打印 假 脱 机 守护 进程 在 其 他 计算 机 系统 运行 的 同时 在 客户 端 系统 上 运行 
print fp. BA, 即便 这 些 系统 使 用 不 同 字 节 序 的 处 理 器 , 这 些 命令 仍 可 运行 (在 
16.3.1 节 讨论 过 字 节 序 )。 
将 作业 名 设 为 要 打印 的 文件 名 。 如 果 作 业 名 的 长 度 超出 了 报 文 所 能 容纳 的 作业 名 字 
段 长 度 ， 那 么 仅 复制 可 容纳 的 作业 名 的 最 后 部 分 。 这 样 就 有 效 地 将 作业 名 的 开头 部 
分 截 去 ， 并 代入 省 略 符 ， 以 表示 该 字段 还 有 更 多 的 字符 。 

[906—106] ”然后 使 用 writen 将 请 求 头发 送 到 守护 进程 (回忆 一 下 我 们 曾 在 图 14-24 中 介绍 过 
H writen iR. writen 函数 使 用 多 个 write 调用 来 传输 指定 数量 的 数据 。 如 


果 写 入 失败 或 者 传输 少 于 期 望 的 数据 ， 将 打印 错误 消息 然后 退出 。 
107 /* 
108 * Now send the file. 
109 */ 
i10 while ((nr = read(fd, buf, IOBUFSZ)) != 0) { 
111 nw = writen(sockfd, buf, nr); 
112 if (nw !- nr) { 
1313 if (nw < 0) 
114 err Sys("can't write to print server"); 
115 else 
116 err_quit ("short write ($d/$d) to print server", 
117 nw, nr); 
118 } 
119 } 
120 /* ; 
121 * Read the response. 
122 */ 
123 if ((nr = readn{sockfd, &res, sizeof(struct printresp))) !- 
124 sizeof (struct printresp)) 
125 err sys("can't read response from server"); 
126 if (res.retcode != 0) { 
127 printf("rejected: $sMn", res.msg); 
128 exit(1); 
129 } else { 
130 printf ("job ID $ld\n", (long)ntohl (res. jobid)); 
131 } 


132 } 

[107—119] ”将 首部 发 送 到 守护 进程 后 ， 发 送 要 打印 的 文件 。 同 时 读 取 文件 的 IOBUFSZ 字 节 并 用 
writen 发 送 数据 到 守护 进程 。 如 果 写 失败 或 者 写 少 了 ， 那 么 就 打印 错误 信息 并 退出 。 

[120—132] ”把 要 打印 的 文件 发 送 给 守护 进程 后 ， 读 取 守 护 进程 的 响应 数据 。 如 果 请 求 失败 ， 返 
I (retcode) 为 非 零 值 ， 并 且 将 响应 中 的 本 文 形式 的 错误 信息 打印 出 来 。 如 
果 请 求 成 功 ， 将 打印 作业 ID， 用 户 此 后 可 以 使 用 此 ID 引用 该 请 求 。( 我 们 将 写 一 
个 命令 取消 一 个 挂 起 的 打印 请 求 留 作 练 习 ; 作业 ID 可 以 用 于 取消 作业 请 求 ， 其 作 
用 是 从 打印 队列 中 识别 要 删除 的 作业 ， 参 见习 题 21.5)。 当 submin file 返回 到 
main 函数 时 ， 退 出 ， 表 明 请 求 成 功 。 
注意 , 一 个 成 功 的 守护 进程 响应 并 不 意味 着 打印 机 可 以 打印 该 文件 , 仅仅 意味 着 守 
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护 进 程 成 功 地 将 其 加 入 到 打印 作业 队列 。 
现在 print 命令 已 经 完全 了 解 过 了 。 我 们 要 看 的 最 后 一 个 C 源 代码 文件 是 打印 假 脱 机 守护 





/* 

* Print server daemon. 
*/ 

#include "apue.h" 
#include «fcntl.h» 
#include «dirent.h» 
#include <ctype.h> 
#include <pwd.h> 
#include <pthread.h> 
#include <strings.h> 
#include <sys/select.h> 
#include <sys/uio.h> 


a ee) 
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13 #include "print.h" 
14 #include "ipp.h" 


15 .~* 
16 * These are for the HTTP response from the printer. 
17 */ 


18 #define HTTP INFO(x) ((x) >= 100 && (x) <= 199) 
19 #define HTTP SUCCESS(x) ((x) >= 200 && (x) <= 299) 


20 /* 

21  * Describes a print job. 

22 ey 

23 struct job ( 

24 struct job *next; /* next in list */ 

25 struct job *prev; /* previous in list */ 

26 long jobid; /* job ID */ 

27 struct printreq req; /* copy of print request */ 
28 }; 

29 /* 

30 * Describes a thread processing a client request. 

3l  */ 

32 struct worker thread | 

33 struct worker thread *next; /* next in list */ 

34 struct worker thread *prev; /* previous in list */ 
35 pthread t tid; /* thread ID */ 

36 int sockfd; /* socket */ 

37 ); 


[17-19] ”打印 假 脱 机 守护 进程 包括 前 面 看 到 的 IPP 头 文件 ， 因 为 守护 进程 需要 用 这 个 协议 与 打 
印 机 通信 。HTTP_INFO 和 HTTP_SUCCESS FX J HTTP 请 求 的 状态 (IPP 建立 在 
HTTP 之 上 )。RFC 2616 第 10 节 定 义 了 HTIP 状态 码 。 
[20—37] “ 假 脱 机 守护 进程 使 用 job 和 worker thread 结构 来 跟踪 相应 的 打印 作业 和 接受 打 
印 请 求 的 线程 。 


38 /* 
39  * Needed for logging. 
40 */ 
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4i int log to stderr - 0; 
42 /* 
43 * Printer-related stuff. 
44  */ 
45 struct addrinfo *printer; 
46 char *printer, name; 
47 pthread mutex t configlock = PTHREAD MUTEX INITIALIZER; 
48 int reread; 
49 /* 
50 +*+ Thread-related stuff. 
51 */ 
52 struct worker thread *workers; 
53 pthread mutex t workerlock = PTHREAD MUTEX INITIALIZER; 
54 sigset t mask; 
55 /* 
56 * Job-related stuff. 
57  */ 
58 struct job *jobhead, *jobtail; 
59 int jobfd; 
[38~41] ”日 志 函 数 需要 定义 10g to stderr 变量 ， 并 且 将 其 设 为 0， 将 日 志 消息 发 送 到 系统 
日 志 而 不 是 标准 错误 。 在 print.c 中 ， 即 使 在 用 户 命令 中 不 使 用 日 志 ， 也 定义 
log to stderr 并 将 其 设置 为 1。 如 果 将 实用 工具 函数 拆 分 为 两 个 独立 的 文件 : 一 
个 用 于 服务 器 ， 另 一 个 用 于 客户 端 命令 ， 则 可 以 避免 这 种 情况 。 
[42—48] ”使 用 全 局 指针 变量 printer 来 保存 打印 机 的 网 络 地 址 .在 printer name 中 保存 打 
印 机 的 主机 名 。configlock 用 于 防止 访问 reread 变量 ， 该 变量 用 来 表示 守护 进 
程 需 要 再 次 读 取 配置 文件 ， 原 因 可 能 是 管理 员 改 变 了 打印 机 网 络 地 址 。 
[49—54] ”接着 ,定义 与 线程 相关 的 变量 。 使 用 workers 作为 双向 链表 的 头 部 ， 该 表 用 于 接收 来 自 
客户 端的 文件 。 采用 workerlock 互 斥 量 来 保护 该 表 。 变量 mask 用 于 线程 的 信和 号 掩 码 。 
[55—59] ”对 于 挂 起 作业 的 链表 , 定义 jobhead 为 表 头 , jobtail 为 表 尾 。 该 表 也 是 双向 链表 ， 
但 是 需要 将 作业 加 入 到 表 尾 ， 所 以 需要 一 个 指针 来 记 住 表 尾 。 至 于 表 中 工作 者 线程 的 
顺序 是 无 关 紧 要 的 。 因 此 可 以 将 它们 加 入 到 表 头 而 不 需要 记 住 尾 指针 。jobfd 是 作业 
文件 的 文件 描述 符 。 
60 int32 t nextjob; 
61 pthread mutex t joblock - PTHREAD MUTEX INITIALIZER; 
62 pthread cond t jobwait - PTHREAD COND INITIALIZER; 
63 /* 
64  * Function prototypes. 
65  »*/ 
66 void init request(void); 
67 void init printerí(void); 
68 void update jobno(void); 
69 int32 t get newjobno(void); 
70 void add job(struct printreq *, int32 t); 
71 void replace jobí(struct job *); 
72 void remove_job(struct job *); 
73 void build qonstart (void); 
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74 void *client thread(void *); 

75 void *printer thread(void *); 

76 void *signal thread(void *); 

77 ssizet readmore(int, char **, int, int *); 
78 int printer status(int, struct job *); 
79 void add worker(pthread t, int); 

80 void kill workers (void); 

81 void client cleanup(void *); 

82 /* 


83 * Main print server thread. Accepts connect requests from 
84 * clients and spawns additional threads to service requests. 





85 * 

86  * LOCKING: none. 

87  */ 

88 int 

89 main(int argc, char *argv[]) 

90 { 

91 pthread t tid; 

92 struct addrinfo *ailist, *aip: 

93 int Sockfd, err, i, n, maxfd; 

94 char *host; 

95 fd set rendezvous, rset; 

96 struct sigaction Sa; 

97 struct passwd *pwdp; 

[60—62] nextjob 是 接收 的 下 一 个 打印 作业 的 ID. BARE joblock 保护 作业 表 ， 同 时 还 有 
jobwait 代表 的 条 件 变量 。 

[63—81] ”声明 此 文件 中 所 有 余下 的 函数 的 原型 。 提 前 做 好 这 些 工作 可 以 使 得 在 文件 中 放置 函 
数 时 不 用 担心 函数 调用 的 顺序 。 

[822—97] ”打印 假 脱 机 守护 进程 的 main 函数 执行 两 个 任务 : 初始 化 守护 进程 然后 处 理 来 自 客 

户 端的 连接 请 求 。 

98 if (argc != 1) 

99 err quit("usage: printd"); 

100 daemonize ("printd"); 

101 sigemptyset(&sa.sa mask); 

102 sa.sa flags = 0; 

103 sa.sa handler = SIG IGN:; 

104 if (sigaction(SIGPIPE, &sa, NULL) < 0) 

105 log sys("sigaction failed"); 

106 sigemptyset (&mask) ; 

107 sigaddset (&mask, SIGHUP); 

108 sigaddset(&mask, SIGTERM); 

109 if ((err = pthread sigmask(SIG BLOCK, &mask, NULL)) != 0) 

110 log sys("pthread sigmask failed"); 

111 n = sysconf( SC HOST NAME MAX) ; 

112 if {n < 0) /* best guess */ 

113 n = HOST NAME MAX; 

114 if ((host = malloc{n)) == NULL) 

115 log sysí("malloc error"); 

116 if (gethostname(host, n) < 0) 


117 log sys("gethostname error"); 
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118 if ((err = getaddrlist(host, "print", &ailist)) != 0) { 

119 log quit("getaddrinfo error: ts", gai strerror(err)); 

120 exit (1); 

121 ) 

[98—100] 守护 进程 没有 任何 选项 (唯一 的 参数 是 命令 名 自身 )， 所 以 如 果 arge 不 为 1， 调 用 
err quit 打印 错误 信息 然后 退出 。 调 用 图 13-1 所 示 程 序 中 的 daemonize 函数 成 为 
一 个 守护 进程 。 在 此 之 后 ， 不 能 在 标准 错误 上 打印 错误 消息 ， 而 是 对 其 记录 日 志 。 

[101 一 110] 忽略 SIGPIPE。 接 下 来 将 要 写 套 接 字 文 件 描 述 符 ， 并 且 不 想 让 写 错误 触发 
SIGPIPE, 因为 其 默认 动作 是 杀 死 进程 ,下 一 步 , 设置 线程 信号 掩 码 , 包括 SIGHUP 
和 SIGTERM。 创 建 的 所 有 进程 均 继承 这 个 信号 掩 码 。 使 用 SIGHUP 信号 告诉 守 
护 进 程 再 次 读 取 配 置 文 件 ，SIGTERM 信和 号 告诉 守护 进程 执行 清理 工作 并 优雅 地 
退出 。 

[111—117] ”调用 sysconf 来 获取 主机 名 的 最 大 长 度 。 如 果 sysconf 失败 或 者 没有 定义 该 限 
fi], XH HOST_NAME MAX 作为 最 佳 选 择 。 有 时 ， 平 台 已 经 定义 了 此 常量 ， 但 如 
果 没 有 定义 ， 则 在 print .h 中 选择 属于 自己 的 值 。 分 配 内 存 来 保存 主机 名 并 调用 
gethostname 来 获取 。 

[118—121] ” 接 下 来 ， 尝 试 找到 用 于 守护 进程 提供 打印 假 脱 机 服务 的 网 络 地 址 。 

122 FD ZERO(&rendezvous);: 

123 maxfd = -1; 

124 for (aip = ailist; aip != NULL; aip = aip-»ai next) { 

125 if ((sockfd = initserver(SOCK STREAM, aip-»ai, addr, 

126 aip-»ai addrlen, QLEN)) >= 0) 1 

127 FD SET(sockfd, &rendezvous); 

128 if (sockfd » maxfd) 

129 maxfd = sockfd; 

130 } 

131 ` } 

132 if (maxfd == -1) 

133 log quit("service not enabled"); 

134 pwdp = getpwnam(LPNAME); 

135 if (pwdp == NULL) 

136 log sys("can't find user %s", LPNAME); 

137 if (pwdp-»pw uid == 0) 

138 log quit("user $s is privileged", LPNAME); 

139 if (setgid(pwdp-»pw gid) < 0 || setuid(pwdp-»pw uid) < 0) 

140 log sys("can't change IDs to user $s", LPNAME); 

141 init request(); 

142 init printer(); 

[122—131] WẸ rendezvous 变量 ,该 变量 将 与 select 一 起 用 来 等 待 客户 端 连接 请 求 。 将 


[132 一 133] 


最 大 文件 描述 符 初始 化 为 -1， 以 确保 所 分 配 的 第 一 个 文件 描述 符 会 大 于 maxfd. 
对 于 每 个 需要 提供 服务 的 网 络 地 址 , 调用 initserver ( 见 图 16-22) 来 分 配 和 初 
始 化 一 个 套 接 字 。 如 果 initserver 成 功 ， 将 其 文件 描述 符 加 入 £d set; 如果 
该 描述 符 大 于 现 有 最 大 值 maxfd， 将 maxfd 设 为 该 描述 符 值 。 

走 完整 个 addrinfo 结构 列表 后 ,如果 maxta 仍 为 -1, 不 能 启动 打印 假 脱 机 服务 ， 


oo 
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记录 日 志 然 后 退出 。 


[134—140] ”守护 进程 需要 超级 用 户 特权 来 绑 定 一 个 套 接 字 到 保留 端口 。 完 成 绑 定 后 ， 通 过 将 用 户 
ID 改变 为 lp 的 用 户 (回忆 21.4 节 的 安全 方面 的 讨论 ) 降低 该 程序 特权 。 这 里 想 
遵循 最 小 特权 原则 ， 以 避免 在 守护 进程 中 将 系统 暴露 给 任何 可 能 的 攻击 。 调 用 
getpwnam 来 找到 与 用 户 lp 相关 的 口令 条 目 。 如 果 没 有 此 用 户 ， 或 者 ip 具有 超级 
用 户 特 权 ， 记录 日 志 然 后 退出 。 否 则 ,调用 setuid 将 实际 用 户 ID 和 有 效用 户 ID 改 
为 lp HIP ID. 为 了 避免 暴露 系统 , 如 果 不 能 减少 特权 , 那么 就 选择 不 提供 任何 服务 。 

[141—142] ”调用 init_request 来 初始 化 作业 请 求 并 确保 只 有 一 个 守护 进程 副本 正在 运行 。 
调用 init_printer 初始 化 打印 机 信息 〈 稍 后 就 可 以 看 到 这 两 个 函数 )。 

143 err = pthread create(&tid, NULL, printer thread, NULL); 

144 if (err -- Q) 

145 err = pthread create(&tid, NULL, signal thread, NULL); 

146 if (err !- 0) 

147 log exit (err, "can't create thread"); 

148 build, qonstart(); 

149 log_msg ("daemon initialized"); 

150 for (77) { 

151 rset = rendezvous; 

152 if (select (maxfd+1, &rset, NULL, NULL, NULL) < 0) 

153 log sys("select failed"); 

154 for (i = 0; i <= maxfd; i++) I 

155 if (FD ISSET(i, &rset)) ( 

156 /* 

157 * Accept the connection and handle the request. 

158 */ 

159 if ((sockfd = accept (i, NULL, NULL)) < 0) 

160 log_ret ("accept failed"); 

161 pthread create(&tid, NULL, client thread, 

162 (void *)((long)sockfd)); 

163 } 

164 } 

165 } 

166 exit(1); 

167 ) 

[143—149] ”创建 一 个 处 理 信号 的 线程 和 一 个 与 打印 机 通信 的 线程 。( 通 过 限制 打印 机 只 与 一 个 
线程 通信 ， 可 以 简化 与 打印 机 相关 的 数据 结构 的 锁定 。) 然后 调用 
build_gonstart 在 /var/spool/printer 目录 中 搜索 任何 挂 起 的 作业 。 对 于 
找到 的 每 个 作业 ， 将 建立 一 个 结构 ， 让 打印 机 线程 将 该 作业 的 文件 送 到 打印 机 。 至 
此 , 完成 守护 进程 的 设置 , 因此 记录 一 条 日 志 消 息 , 表明 守护 进程 初始 化 成 功 完 成 。 

[150—167] 将 rendezvous £d set 结构 复制 到 rset,， 然后 调用 select 等 待 其 中 的 一 个 文件 
描述 符 变 为 可 读 。 必 须 复 制 rendezvous, AW select 会 修改 传 入 的 £d, sec 结构 
来 包含 满足 事件 的 文件 描述 符 。 既 然 服 务 器 已 经 将 套 接 字 初始 化 完毕 ， 一 个 可 读 的 文 
件 描述 符 就 意味 着 一 个 连接 请 求 需要 处 理 。 当 select 返回 时 ， 检 查 rset 来 获取 一 
个 可 读 的 文件 描述 符 。 如 果 找 到 一 个 ， 调 用 accept 接受 该 请 求 。 如 果 失 败 ， 记 录 日 
志 然 后 继续 检查 更 多 的 可 读 文件 描述 符 。 和 否则 ， 创 建 一 个 线程 来 处 理 客户 端 请 求 。 主 





21.5 源 代 码 663 


线程 main 一 直 循 环 ， 将 请 求 发 送 到 其 他 线程 处 理 ， 永 远 不 应 到 达 exit 语句 。 


168 /* 

169 * Initialize the job ID file. Use a record lock to prevent 

170 * more than one printer daemon from running at a time. 

LII * 

172 * LOCKING: none, except for record-lock on job ID file. 

173 DEZ 

174 void 

175 init request(void) 

176 { 

177 int n; 

178 char name [FILENMSZ]; 

179 sprintf(name, “"%s/%s", SPOOLDIR, JOBFILE); 

180  jobfd = open(name, O CREAT|O RDWR, S IRUSR|S IWUSR); 

181 if (write lock(jobfd, 0, SEEK SET, 0) < 0) 

182 log_quit ("daemon already running"); 

183 /* 

184 * Reuse the name buffer for the job counter. 

185 * 

186 if ((n = read(jobfd, name, FILENMSZ)) < 0) 

187 log sys("can't read job file"); 

188 if (n == 0) 

189 nextjob = 1; 

190 else 

191 nextjob = atolíname); 

192 } 

[168—182] ”函数 init request 做 两 件 事 : 在 作业 文件 /var/spool/printer/jobno 上 放 一 
个 记录 锁 , 然后 读 该 文件 并 确定 下 一 个 要 赋值 的 作业 编号 。 在 整个 文件 上 放置 一 把 写 锁 ， 
表明 守护 进程 正在 运行 。 如 果 当前 已 有 一 个 守护 进程 正在 运行 ， 想 启动 另外 一 个 打印 假 
脱 机 守护 进程 副本 ， 该 程序 将 无 法 获得 写 锁 ， 然 后 就 退出 。 因 此 ， 同 时 只 能 有 一 个 守护 

| 进程 在 运行 。( 图 13-6 中 使 用 过 这 种 技术 ， 在 143 节 中 讨论 过 write lock A.) 

[183—192] ”作业 文件 包含 一 个 ASCI 码 的 整数 字符 串 来 表示 下 一 个 作业 编号 。 如 果 文 件 刚 创建 
并 且 为 空 ， 那 么 将 nextjob 设置 为 1。 和 否则 ， 使 用 atol 将 字符 串 转换 为 整数 并 
将 其 作为 下 一 个 作业 编号 。 让 jobfd 对 于 作业 文件 保持 打开 状态 ， 因 此 当 作 业 创 
建 时 能 够 更 新 作业 编号 。 不 能 关闭 该 文件 ， 因 为 这 将 释放 已 经 放置 在 上 面 的 写 锁 。 
在 一 个 长 整 型 数 长 度 为 64 位 的 系统 上 ， 至 少 需要 一 个 21 字 节 的 缓冲 区 来 存放 代表 最 大 长 
整 型 数 的 字符 串 。 这 里 重用 文件 名 缓冲 区 ， 因 为 在 print.h "P FILENMSZ 定义 为 64。 

193 /* 

194 * Initialize printer information from configuration file. 

195 * 

196  * LOCKING: none. 

197 *7/ 

198 void 

199 init printer(void) 

200 | 

201 printer = get printaddr(: 

202 if (printer -- NULL) 

203 exit(1); /* message already logged */ 

204 printer name = printer--»ai canonname; 
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205 
206 
207 
208 


209 
210 
211 
212 
213 
214 
215 
216 
217 
218 


219 
220 
221 
222 
223 
224 
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if (printer name -- NULL) 
printer, name = "printer"; 
log msg("printer is $s", printer name); 


* Update the job ID file with the next job number. 
* Doesn't handle wrap-around of job number. 


* LOCKING: none. 
*/ 
void 
update_jobno (void) 
{ 

char buf[32]; 


if (lseek(jobfd, 0, SEEK SET) == -1) 
log sys("can't seek in job file"); 
sprintf(buf, "$d", nextjob); 
if (write(jobfd, buf, strlen(buf)) < 0) 
log sys("can't update job file"); 
) 


[193—208] init printer 用 于 设置 打印 机 名 和 地 址 。 调用 get printaddr (KÁ util.c) 


获得 打印 机 地 址 。 如 果 失 败 ， 记 录 呈 志 并 退出 。 当 找 不 到 打印 机 地 址 时 ， 
get printaddr 会 记录 自己 的 错误 信息 日 志 。 如 果 打 印 机 地 址 未 找到 ， 将 
addrinfo 中 的 ai_canonname 设 为 打印 机 名 。 如 果 该 字段 为 空 ， 将 打印 机 名 设 
为 默认 值 。 注 意 ， 将 正在 使 用 的 打印 机 名 也 记录 在 日 志 中 ， 以 帮助 管理 员 能 够 诊断 
假 脱 机 系统 的 问题 。 


[209—224] update jobno 函数 用 于 在 作业 文件 /var/spool/printer/jobno 中 写 入 下 一 


个 作业 编号 。 首 先 ， 找 到 文件 开头 。 然 后 ， 将 整数 作业 编号 转换 为 一 个 字符 串 并 写 
入 文件 。 如 果 写 入 失败 ， 记 录 日 志 并 退出 。 作 业 编号 自动 递增 。 如 何 处 理 回 绕 的 作 
业 编 号 留 作 一 个 练习 《见习 题 21.9)。 

/* 

* Get the next job number. 

* LOCKING: acquires and releases joblock. 

*/ 

int32 t 

get newjobno (void) 

i 

int32 t jobid; 


pthread mutex lock(&joblock); 
jobid = next jobtt+; 
if (nextjob <= 0) 

nextjob = 1; 
pthread mutex unlock(&joblock); 
return(jobid); 


/* 
* Add a new job to the list of pending jobs. Then signal 
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243 * the printer thread that a job is pending. 
244 * 

245  * LOCKING: acquires and releases joblock. 
246  */ 

247 void 

248 add job(struct printreq *reqp, int32 t jobid) 
249 { 

250 struct job *jp; 


251 if ((jp = malloc(sizeof (struct job))) == NULL) 
252 log_sys ("malloc failed"); 
253 memcpy (&jp->req, regp, sizeof(struct printreq)); 


[225—240] get newjobno 函数 用 于 获得 下 一 个 作业 编号 。 首 先 将 joblock 互 斥 量 锁 住 。 递 
增 nextjob 变量 ,并 处 理 回 绕 的 情况 。 然 后 解锁 互 斥 量 并 返回 递增 前 的 nextjob 
值 。 多 个 线程 可 以 同时 调用 get newjobno: 需要 串 行 化 访问 下 一 个 作业 编号 ， 
因此 每 个 线程 得 到 一 个 唯一 的 作业 编号 。( 见 图 11-9， 考 察 在 这 种 情况 下 ， 如 果 不 
串 行 化 线程 会 发 生 什么 情况 。) 

[241—253] add job 函数 用 于 在 挂 起 的 打印 作业 列表 中 增加 一 个 新 的 作业 请 求 。 首 先 为 job 
结构 分 配 空间 。 如 果 失 败 ， 记 录 日 志 并 退出 。 此 时 ， 打 印 请 求 已 经 安全 地 存储 在 磁 
Bib. 当 打 印 假 脱 机 守护 进程 重启 时 ， 会 重新 读 取 这 些 请 求 。 当 为 新 作业 分 配 完 空 
间 , 将 客户 端的 请 求 结构 复制 到 作业 结构 。 在 Print .h 中 一 个 job 结构 包含 一 对 
列表 指针 ， 一 个 作业 ID 和 一 个 从 客户 端 print 命令 发 送 过 来 的 printreq 结构 
副本 。 

254 jp->jobid = jobid; 

255 jp->next = NULL; 

256 pthread_mutex_lock (&joblock) ; 


257 jp->prev = jobtail; 
258 if (jobtail == NULL) 


259 jobhead = jp; 
260 else 
261 jobtail->next = jp; 


262 jobtail = jp; 
263 pthread mutex unlock(&joblock); 
264 pthread cond signal(&jobwait); 


265 ) 

266 /* 

267  * Replace a job back on the head of the list. 
268 * 

269  * LOCKING: acquires and releases joblock. 
270  */ 

271 void 

272 replace job(struct job *jp) 

273 | 

274 pthread mutex lock(&joblock); 

275 jp->prev = NULL; 


276 jp->next = jobhead; 

277 if (jobhead == NULL) 
278 jobtail = jp; 

279 else 

280 jobhead->prev = jp; 
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281 
282 
283 


[266—283] 


284 
285 
286 
287 
288 
289 
290 
291 
292 
293 
294 
295 
296 
297 
298 
299 
300 


301 
302 
303 
304 
305 
306 
307 
308 
309 
310 
311 
312 
313 
314 


315 
316 
317 


[284~300] 
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jobhead = jp: 
pthread mutex unlock(&joblock); 
} 


[254—265] 保存 作业 ID 并 锁 住 joblock 互 斥 量 以 获得 对 打印 作业 链表 的 独占 访问 。 将 在 该 链 
表 尾 增加 新 的 作业 结构 。 将 新 的 作业 结构 的 前 项 指针 Cprevious pointer) 指向 链表 
中 最 后 一 个 作业 。 如 果 链 表 为 空 ， 将 jobhead 指向 新 的 结构 。 否 则 ， 将 链表 中 最 
后 一 项 的 后 项 指针 《next pointer〉 指 向 新 的 结构 。 然 后 设置 jobtail 指向 新 的 结 
构 。 对 互 斥 量 解锁 ， 然 后 给 打印 机 线程 发 信号 ， 告 诉 该 线程 另 一 个 作业 可 用 了 。 
函数 replace job 用 于 将 作业 插入 到 挂 起 作业 队列 头 部 。 需 要 获得 joblock E 
斤 量 ， 将 job 结构 中 的 前 项 指针 设 为 NULL， 将 后 项 指针 指向 表 头 。 如 果 表 为 空 ， 
将 jobtail 指向 插入 的 job 结构 。 否 则 ， 将 表 中 第 一 个 作业 结构 的 前 项 指针 指向 
插入 的 job 结构 。 然 后 将 jobhead 指向 插入 的 job 结构 ， 成 为 新 的 表 头 。 最 后 ， 


释放 joblock HH. 
/* 
* Remove a job from the list of pending jobs. 
* 
* LOCKING: caller must hold joblock. 
ef 
void 
remove_job(struct job *target) 
{ 
if (target->next != NULL) 
target-»next-»prev = target->prev; 
else 
jobtail = target->prev; 
if (target->prev !- NULL) 
target->prev->next = target-»next; 
else 
jobhead = target->next; 


} 


/* 

* Check the spool directory for pending jobs on start-up. 
* 

* LOCKING: none. 

*/ 

void 
build qgonstart (void) 

{ 


int fd, err, nr; 

int32 t jobid; 

DIR *dirp; 

struct dirent *entp; 

struct printreq req; 

char dname[FILENMSZ], fname[FILENMSZ]; 


sprintf(dname, "%s/%s", SPOOLDIR, REQDIR); 
if ((dirp = opendir(dname)) -- NULL) 
return; 


remove job 将 给 定 的 作业 从 挂 起 的 作业 列表 中 删除 。 调 用 者 必须 已 经 持 有 
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joblock 互 斥 量 。 如 果 后 项 指针 不 为 空 ， 将 下 一 个 条 目的 前 项 指针 指向 被 删除 目 
标的 前 项 指针 所 指向 的 条 目 。 否 则 ， 访 条目 为 列表 中 最 后 一 个 ， 因 此 将 jobtail 
指 回 被 删除 目标 的 前 项 指针 所 指 同 的 条 目 。 如 果 被 删除 目标 的 前 项 指针 不 为 空 ， 将 
前 一 个 条 目的 后 项 指针 指向 被 删除 目标 的 后 项 指针 所 指向 的 条 目 。 否则， 这 个 是 表 
中 第 一 个 条 目 ， 因 此 将 jobhead 指向 被 删除 目标 后 面 的 那个 条 目 。 

[301—317] “ 当 守 护 进程 启动 时 ， 调 用 build qonstart M#MATE/var/spool/printer/reqs 
中 的 磁盘 文件 建立 一 个 内 存 中 的 打印 作业 列表 。 如 果 不 能 打开 该 自 录 ， 表 示 没 有 打 


印 作业 要 处 理 ， 因 此 就 返回 。 
318 while ((entp = readdir(dirp)) !- NULL) { 
319 /* 
320 * Skip." and ".." 
321 */ 
322 if (strcmp(entp-»d name, ".") == Q || 
323 strcmp(entp-»d name, "..") == 0) 
324 continue; 
325 /* 
326 * Read the request structure. 
327 */ 
328 sprintf(fname, "%s/%s/%s", SPOOLDIR, REQDIR, entp-»d name); 
329 if ((fd = open(fname, O RDONLY)) < 0) 
330 continue; 
331 nr = read(fd, &req, sizeof(struct printreq)); 
332 if (nr != sizeof(struct printreq)) { 
333 if (nr « 0) 
334 err - errno; 
335 else 
336 err = EIO; 
331 close (fd); 
338 log_msg("build_qonstart: can't read $s: $s", 
339 fname, strerror(err)); 
340 unlink (fname); 
341 sprintf (fname, "%s/%s/%s", SPOOLDIR, DATADIR, 
342 entp-»d name); 
343 unlink (fname); 
344 continue; 
345 } 
346 jobid = atol (entp->d_name) ; 
347 log_msg ("adding job %d to queue", jobid); 
348 add_job(&req, jobid); 
349 } 
350 closedir(dirp); 
351 } 


[318—324] 在 目录 中 一 次 读 取 一 个 条 目 ， 忽 略 . 和 . .。 

(325~345] “对 于 每 个 条 目 ， 创 建 一 个 文件 完全 路 径 名 并 只 读 打 开 。 如 果 open 调用 失败 ， 跳 过 
该 文件 。 否 则 ， 将 读 取保 存在 文件 中 的 printreq 结构 。 如 果 不 能 读 取 整 个 结构 ， 
关闭 该 文件 ， 记 录 日 志 并 unlink 该 文件 。 然 后 建立 相应 数据 文件 的 完全 路 径 名 ， 
再 unlink 该 文件 。 

[346—351] ”如 果 能 够 读 取 一 个 完整 的 printreq 结构 ， 将 文件 名 转换 为 作业 ID. 文件 名 就 是 
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其 作业 ID)， 记 录 日 志 ， 然 后 将 请 求 加 入 到 挂 起 的 打印 作业 列表 。 当 读 完整 个 目录 ， 
readdir 返回 NULL， 关 闭 目录 然后 返回 。 


352 /* 

353 * Accept a print job from a client. 

354 * 

455 * LOCKING: none. 

356 *4 

357 void * 

358 client thread(void *arg) 

359. 1 

360 int n, fd, sockfd, nr, nw, first; 
361 int32 t jobid; 

362 pthread t tid; 

363 struct printreq req; 

364 struct printresp res; 

365 char name [FILENMSZ]; 

366 char buf [IOBUFSZ]; 

367 tid = pthread self(); 

368 pthread_cleanup_push(client_cleanup, (void *) ((long)tid)); 
369 sockfd = (lLong)arg; 

370 add_worker(tid, sockfd); 

371 /* 

372 * Read the request header. 

373 xy 

374 if ((n = treadn(sockfd, &req, sizeof(struct printreq), 10)) !- 
375 sizeof(struct printreq)) { 

376 res.jobid - 0; 

377 if (n < 0) 

378 res.retcode = htonl (errno); 

379 else 

380 res.retcode = htonl(EIlO); 

381 strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 
382 writen(sockfd, &res, sizeof (struct printresp)); 
383 pthread exit((void *)1); 

384 } 


[152-370] ” 当 连 接 请 求 被 接受 时 ， main 中 派生 出 client_thread。 其 作用 是 从 客户 端 Print 
命令 中 接收 要 打印 的 文件 。 为 每 个 客户 端 打印 请 求 分 别 创建 一 个 独立 的 线程 。 
首先 是 安装 线程 清理 处 理 程序 ( 见 11.5 节 中 线程 清理 处 理 程序 的 讨论 )。 清理 处 理 程 序 是 
client, cleanup, 将 在 后 面 用 到 。 它 仅 带 一 个 参数 ; AID. 然后 调用 add worker 
来 创建 一 个 worker_thread 结构 并 将 其 加 入 到 活跃 的 客户 端 线程 列表 中 。 

[371 一 384] ”此 时 ,完成 了 线程 的 初始 化 任务 ,因此 从 客户 端 读 取 请 求 头 。 如 果 客户 端 发 送 的 数 
据 少 于 期 望 或 遇 到 错误 ， 则 响应 一 个 消息 ， 该 消息 指出 错误 的 原因 ， 然 后 调用 

pthread_exit 结束 线程 。 


385 req.size = ntohlí(req.size); 
386 req.flags = ntohl(req.flags); 


387 /* 
388 * Create the data file. 
389 */ 
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390 jobid = get newjobno(); 


391 sprintf (name, "%s/%s/%ld", SPOOLDIR, DATADIR, jobid); 
392 fd = creat {name, FILEPERM); 

393 if (fd < 0) | 

394 res.jobid = 0; 

395 res.retcode = htonl(errno); 

396 log msgí("client thread: can't create $s: %s", name, 
397 strerror (res.retcode)); 

398 strncpy(í(res.msg, strerror(res.retcode), MSGLEN, MAX); 
399 writen(sockfd, &res, sizeof(struct printresp)); 
400 pthread exit((void *)1); 

401 } 

402 /* 

403 * Read the file and store it in the spool directory. 
404 * Try to figure out if the file is a PostScript file 
405 * or a plain text file. 

406 */ 

407 first = 1; 

408 while {{nr = tread(sockfd, buf, IOBUFSZ, 20)) > 0) { 
409 if (first) { 

410 first = 0; 

411 if (strnemp(buf, "%!PS", 4) != 0) 

412 req.flags |= PR_TEXT; 

413 } 


[385—401] “将 请 求 头 中 的 整数 字段 转换 成 主机 字 节 序 ， 调 用 get newjobno 来 保存 这 个 打印 
请 求 的 下 一 个 作业 编号 。 建 立 作 业 数 据 文件 , E /var/spool/printer/data/ 
jobid, jobid 是 请 求 的 作业 ID 。 采 用 权限 许可 来 防止 其 他 人 读 取 这 些 文件 (print .h 
中 定义 FILEPERM 为 S_IRUSR1S_IWUSR)。 如 果 不 能 创建 该 文件 , 记录 错误 日 志 ， 
发 送 失败 响应 给 客户 端 ， 调 用 pthread_exit 结束 线程 。 
[402—413] ” 读 取 来 自 客户 端的 文件 内 容 ， 要 将 其 写 入 数据 文件 的 私有 副本 中 。 但 是 在 写 任何 东西 之 
前 , 需要 在 第 一 次 循环 时 检查 一 下 是 否 是 PostScript 文件 。 如 果 该 文件 不 是 以 %$ | PS 模式 
开头 , 可 以 假定 为 其 为 纯 文本 文件 ， 这 种 情况 下 在 请 求 头 中 设置 PR TEXT 标志 。( 如 果 
E print 命令 中 有 -t 标志 ， 那 么 客户 端 也 会 设置 此 标志 。) 尽管 PostScript 程序 不 要 求 
以 模式 8 | Ps 开始 ， 但 文档 格式 指南 (Adobe Systems [1999]) 强烈 推荐 这 种 方式 。 825 


414 nw = write(fd, buf, nr); 

415 if (nw !- nr) ( 

416 res.jobid = 0; 

417 if (nw « 0) 

418 res.retcode = htonl (errno); 

419 else 

420 res.retcode = htonl(EIO); 

421 log msg("client tbread: can't write $s: %s", name, 
422 strerror(res.retcode)); 

423 close(fd); 

424 strncpy(res.msg, strerror(res.retcode), MSGLEN MAX); 
425 writen(sockfd, &res, sizeof(struct printresp)); 
426 unlink (name) ; 

427 pthread exit((void *)1); 

428 } 


429 } 
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430 


411 
432 
433 
434 
435 
436 
437 
Q38 
J35 
Q40 
441 
442 
443 
444 
445 
446 
447 
446 





elose (fd); 


f* 

* Create the control file, Then write the 

" print request information to tha control 

* file. 

fs 

sprintf (name, “ga/ta/3d", SPOOLDIR, REQDIR, jabid): 

fd = creat (nam, FILEPERM): 

if (fd «X OF 1 
raz.j0bid = D; 
res.reteode = hteónlierrno): 
loó3.msQgi"client thread: Can't create $4: ta", nama, 

SLIerrorires.retcode}); 

strncpyiresg.mag, astrerror(res.ratcode), MSGLEN MAX!; 
writenísocktd, tres, sizeolistruct printresp)):; 
sprintfíname, "$2/$2s/4d", SEPOOLDIR, DATADIR, jebid!; 
unlink itame] 7; 
pthread exit((void *)1]:; 

) 


j414-—430] BRAS PRR SASH. QUR write AW. RHR. KARR 


SFR. SUS eee Pie, Me. WA pthread_exit 
退出 。 HER. PERT RAE S AT. SWH pthread exit 时 ， 线 程 
清理 处 理 程序 会 处 理 这 些 事情 。 

当 接 收 到 所 有 要 打印 的 数据 ， 关 闭 数据 文件 的 文件 描述 符 。 


[431—448] PM. HAt /var/spool/printer/reqs/jobid 以 记 仁 打印 请 求 。 如 果 失 


443 
450 
451 
452 
453 
454 
455 
456 
457 
458 
459 
46D 
461 
462 
463 
464 
465 
466 


46? 
468 
465 
470 
471 
472 


Mm. ikSRRHAS. RAMEE, MERAL, EERE, 


nw = write(fd, &ren, aizeof(istrucrE printreq]!: 
46 (nw '- siz&cfistruct printreqs? f 
res.jobld = d; 
if (nw x 0) 
re3.retcode = htonl (errnol: 
else 
re3,retcode = htonl(EID):; 
log msgi"client thread: can't write ts: ta", name, 
strerroc(res.retcode)); 
close (fd): 
Stracpy |res.magq, strecrorlres.retcode), MSGLEN MAX); 
writenisockid, Areas, sizeof (struct printrespl):; 
unlink (name) + 
sprintfiname, *ta/ts/td", SPOOLDIR, DATADIRE, jobid): 
unlinkiname|:; 
pthraad axit(i(vold *}1}; 
! 
claoselfdl: 


if 

* Send response to client. 

ae 

res.retcode = 0; 

res. jbid = htonl (jobid) ; 
aprintfí(res.msqg, "request ID &d", jobidi; 
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473 writen(sockfd, &res, sizeof(struct printresp)); 
474 /* 

475 * Notify the printer thread, clean up, and exit. 
476 žy 

477 log_msg ("adding job $d to queue", jobid); 


478 add job(&req, jobid); 
479 pthread cleanup. pop(1):; 
480 return((void *)0); 

481 } 


[449—465] “将 printredq 结构 写 入 控制 文件 。 如 果 出 错 ， 则 记录 日 志 ,， 关闭 控制 文件 描述 符 ， 
发 送 失败 响应 给 客户 端 ， 删 除数 据 和 控制 文件 ， 终 止 线程 。 

[466—473] ”关闭 控制 文件 的 文件 描述 符 ， 并 发 送 消息 给 客户 端 ， 该 消息 包括 作业 ID 和 成 功 状 
A (retcode 设 为 0)。 

[474—481] ”调用 add job 将 接收 的 文件 加 入 到 挂 起 作业 列表 中 , 调用 pthread cleanup pop 
完成 清理 过 程 。 当 返回 时 线程 终止。 
注意 ， 线 程 退 出 之 前 ， 必 须 关 闭 不 再 使 用 的 任何 文件 描述 符 。 与 线程 终止 不 同 ， 
当 一 个 线程 退出 并 且 进 程 中 仍 有 其 他 线程 时 ， 文 件 描 述 符 不 会 自动 关闭 。 如 果 不 


关闭 不 需要 的 文件 描述 符 ， 终 将 耗 尽 资 源 。 
482 /* 
483 * Add a worker to the list of worker threads. 
484 * 
485 * LOCKING: acquires and releases workerlock. 
486 "y 
487 void 
488 add worker(pthread t tid, int sockfd) 
489 ( 
490 Struct worker thread *wtp; 
491 if ((wtp = malloc (sizeof (struct worker thread))) == NULL) 1 
492 log ret("add worker: can't malloc"); 
493 pthread exit((void *)1); 
494 } 
495 wtp->tid = tid; 
496 wtp->sockfd = sockfd; 
497 pthread mutex lock(&workerlock); 
498 wtp->prev = NULL; 
599 wtp->next = workers; 
500 if (workers != NULL) 
501 workers ->prev = wtp; 
502 
503 workers = wtp; 
504 pthread mutex unlock(&workerlock); 
505 ) 
506 /* 
507 * Cancel (kill) all outstanding workers. 
508 * 
509 * LOCKING: acquires and releases workerlock. 
510 xy 


511 void 
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512 kill, workers (void) 


513 { 

514 struct worker thread *wtp; 

515 pthread mutex lock(&workerlock): 

516 for (wtp = workers; wtp != NULL; wtp = wtp-»next) 
517 pthread_cancel (wtp->tid) ; 

518 pthread_mutex_unlock (&workerlock) ; 

519 } 


[482—505] add worker 将 一 个 worker thread 结构 加 入 活动 线程 列表 中 。 分 配 该 结构 需 


要 的 内 存 ， 初 始 化 它 ， 锁 住 workerlock 互 斥 量 ， 将 结构 加 入 到 列表 的 头 部 ， 然 
ja SLE FERE. 

[506—519] kill workers 函数 遍历 工作 者 线程 列表 ,然后 一 一 删除 。 遍 历 列表 时 持 有 
workerlock 互 斥 量 。 注 意 ，pthread_cancel 仅仅 将 线程 列 入 删除 计划 ， 实 际 


的 删除 动作 在 每 个 线程 到 达 下 一 个 删除 点 时 发 生 。 
520 /* 
521 * Cancellation routine for the worker thread. 
522 * 
523 * LOCKING: acquires and releases workerlock. 
524 *f 
525 void 
526 client cleanup(void *arg) 
527 { 
528 struct worker_thread *wtp; 
529 pthread t tid; 
530 tid = (pthread t) ((long)arg):; 
531 pthread mutex lock(&workerlock); 
532 for {wtp = workers; wtp !- NULL; wtp = wtp-»next) { 
533 if (wtp->tid == tid) { 
534 if (wtp->next != NULL) 
535 wtp-»next-»prev = wtp->prev; 
536 if (wtp-»prev != NULL) 
537 wtp->prev->next = wtp->next; 
538 else 
539 workers = wtp-»next; 
540 break; 
541 } 
542 } 
543 pthread mutex unlock(&workerlock); 
544 if (wtp != NULL) { 
545 close (wtp->sockfd) ; 
546 free (wtp); 
547 } 
548 } 


[520—542] MA client cleanup 是 与 客户 端 命 令 通 信 的 工作 者 线程 的 线程 清理 程序 。 当 线 


程 调用 pthread exit 时 ， 或 者 用 一 个 非 0 参数 调用 pthread_cleanup_pop， 

或 者 响应 一 个 删除 请 求 时 ，client_cleanup 函数 会 被 调用 。 其 参数 是 终止 线程 
的 线程 ID。 

锁 住 workerlock 互 斥 量 然后 搜索 工作 者 线程 列表 ,直到 找到 一 个 匹配 的 线程 ID. 
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当 找 到 一 个 匹配 时 ， 从 列表 中 删除 工作 者 线程 结构 并 且 停 止 搜索 。 

[543—548] ”解锁 workerlock 互 斥 量 ， 关 闭 线 程 用 于 和 客户 端 通信 的 套 接 字 文 件 描述 符 ， 然 
后 释放 worker thread 结构 的 内 存 。 
SLR BRE workerlock 互 斥 量 ， 当 kill workers 函数 正在 遍历 列表 时 ， 如 果 
一 个 线程 到 达 一 个 删除 点 时 ， 必 须 等 待 直到 kill workers 释放 互 斥 量 时 才 可 以 


继续 处 理 。 
549 Z* 
550 * Deal with signals. 
551 * 
552 * LOCKING: acquires and releases configlock. 
553 *f 


554 void * 
555 signal thread(void *arg) 


556 i 

557 int err, signo; 

558 for (;;) { 

559 err = sigwait(&mask, &signo); 

560 if (err != 0) 

561 log quit("sigwait failed: %s", strerror(err)); 
562 switch (signo) ( 

563 case SIGHUP: 

564 A 

565 * Schedule to re-read the configuration file. 
566 i 

567 pthread mutex lock(&configlock); 

568 reread = 1; 

569 pthread mutex unlock(&configlock); 

570 break; 

571 case SIGTERM: 

572 kill workers ():; 

573 log_msg ("terminate with signal $s", strsignal (signo)); 
574 exit (0); 

575 default: 

576 kill workers(); 

577 log quit("unexpected signal $d", signo); 

578 ) 

579 } 

580 } 


[549—562] MX signal_thread 由 负责 处 理 信号 的 线程 运行 。 在 main 函数 中 初始 化 信号 掩 
码 ， 该 掩 码 包 括 SIGHUP 和 SIGTERM. XE, WH sigwait 来 等 待 这 些 信号 中 
的 一 个 出 现 。 如 果 sigwait 失败 ， 记 录 出 错 日 志 并 退出 。 

[563-570] ”如 果 接 收 到 SIGHUP， 然 后 获得 configlock HFE, 将 reread 变量 设 为 1， 释放 
互 斥 量 。 这 就 告诉 打印 机 守护 进程 在 其 处 理 循环 的 下 一 次 迭代 时 再 次 读 取 配 置 文件 。 

[571—574] ”如 果 接 收 到 SIGTERM, 调用 kill workers 来 杀 死 所 有 的 工作 者 线程 , 记录 日 志 ， 
然后 调用 exit 终止 进程 。 

[575~580] “如果 接 收 到 非 期 望 的 信号 , 则 杀 死 工作 者 线程 并 调用 10g quit 来 记录 日 志 然 
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581 
582 
583 
584 
585 
586 
587 
588 
589 
590 
591 
592 
593 


594 
595 
596 
597 
598 
699 
600 
601 
602 
603 
604 
605 
606 
607 


后 退出 。 


/* 
* Add an option to the IPP header. 
* 
* LOCKING: none. 
*/ 
char * 
add option(char *cp, int tag, char *optname, char *optval) 
( 
int n; 
union { 
intl6_t s; 
char c[2]: 
} u; 


*cptt = tag; 
n = strlen(optname); 
u.s = htons(n); 
*ept+ = u.c[0]; 
*cptt = u.c[1]; 
strcpy(cp, optname); 
cp += n; 
n = strlen(optval); 
u.s = htons (n); 
*cp* = u.c[0]: 
*cpt* = u.c[1]; 
strcpy(cp, optval); 
return(cp -* n); 

} 


[581—593] MM add option 用 于 在 送 到 打印 机 的 IPP 首部 中 添加 一 个 选项 ， 回 忆 图 21-4, 


属性 的 格式 是 | 字 节 的 描述 属性 类 型 的 标志 ， 然 后 是 以 2 字 节 的 二 进 制 整 数 形式 
存储 的 属性 名 字 的 长 度 ， 接 着 是 名 字 ， 属 性 值 的 长 度 ， 最 后 是 属性 值 本 身 。 

IPP 没有 打算 去 控制 嵌入 在 首部 的 二 进 制 整数 的 对 齐 方式 。 一 些 处 理 器 架构 ,例如 
SPARC， 并 不 能 从 任意 地 址 装 入 一 个 整数 。 这 意味 着 不 能 通过 如 下 方式 在 PP 首 
部 存放 一 个 整数 :该 方式 将 一 个 指针 转换 成 ijnt16_t 指向 在 首部 存放 整数 的 地 
址 。 相 反 ， 需 要 一 次 复制 1 字 节 整数 。 这 就 是 为 什么 我 们 定义 一 个 包含 16 位 整数 
和 2 字 节 数组 的 union。 


[594—607] ”在 首部 存储 标志 并 将 属性 名 字 的 长 度 转换 为 网 络 字 节 序 。 一 次 复制 1 个 字 节 到 首 


608 
609 
610 
611 
612 
613 
614 
615 
616 


部 。 接 着 复制 属性 名 字 。 重 复 这 个 过 程 ， 继 续 复制 属性 值 ， 并 返回 首部 中 下 一 个 
应 该 开始 的 部 分 的 地 址 。 

/* 

* Single thread to communicate with the printer. 


* LOCKING: acquires and releases joblock and configlock. 
my 

void * 

printer_thread(void *arg) 

{ 

struct job *Jp:; 





628 
629 
630 
631 
632 
633 
634 
635 
636 
637 
638 
639 
640 


[608—627] 函数 printer thread 由 与 网 络 打印 机 通信 的 线程 运行 。 使 用 icp 和 ibuf 来 


21.5 源 代码 675 


int hlen, ilen, sockfd, fd, nr, nw, extra; 
char *icp, *hcp, *p: 

struct ipp hdr *hp; 

struct stat sbuf; 

struct iovec iov[2]:; 

char name [FILENMSZ]; 

char hbuf [HBUFSZ] ; 

char ibuf [IBUFS2]; 

char buf [IOBUFS2]; 

char str[64]; 


struct timespec ts = { 60, 0); /* 1 minute */ 


for (77) ( 
/* 
* Get a job to print. 
xy 
pthread_mutex_lock (&joblock) ; 
while (jobhead == NULL) { 
log msgí"printer thread: waiting..."); 
pthread cond wait(&jobwait, &joblock); 
} 
remove job(jp = jobhead); 
log msg("printer thread: picked up job %d", jp->jobid); 
pthread mutex unlock(&joblock); 
update jobno():; 


建立 IPP 首部 。 使 用 hcp 和 hbuf 建立 HTTP 首部 。 需 要 在 独立 的 缓冲 区 中 建立 
首部 。HTTP 首部 包括 ASCH 表示 的 长 度 字段 ， 而 且 在 拼装 出 PP 首部 之 前 ， 并 
不 知道 应 该 预 留 多 大 的 空间 。 在 一 次 调用 中 使 用 writev 来 写 这 两 个 头 。 


[628—640] ”打印 机 线程 在 一 个 等 待 将 作业 传送 到 打印 机 的 无 限 循 环 中 运行 。 使 用 joblock 


641 
642 
643 
644 
645 
646 
647 
648 
649 
650 
651 
652 
653 
654 


655 
656 


互 斥 量 来 保护 作业 列表 。 如 果 作 业 没 有 挂 起， 使 用 pthread cond wait 来 等 
待 到 来 的 作业 。 当 一 个 作业 准备 好 时 ， 调 用 remove job 将 其 从 列表 中 删除 。 
此 时 仍 持 有 互 斥 量 ， 因 此 释放 互 斥 量 并 调用 update jobno 将 下 一 个 作业 号 编 


5 AS|/var/spool/printer/jobno. 
/* 
* Check for a change in the config file. 
*/ 
pthread,mutex lock(&configlock); 
if (reread) { 
freeaddrinfo(printer); 
printer = NULL; 
printer_name = NULL; 
reread = 0; 
pthread mutex unlock(&configlock); 
init, printer(); 
} else { 
pthread_mutex_unlock (&configlock) ; 


} 


/* 
* Send job to printer. 
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[641 一 654] 


[655—671] 


672 
673 
674 
675 
676 
677 


678 
679 
680 
681 
682 
683 
684 
685 
686 
687 
688 
689 
690 
691 
692 
693 
694 
695 
696 


*/ 
sprintf(name, "%s/%s/%ld", SPOOLDIR, DATADIR, jp-»jobid); 
if ((fd = open(name, O RDONLY)) < 0) | 
log msg("job $1d canceled - can't open %s: $s", 
jp->jobid, name, strerror(errno)); 
free (jp); 
continue; 
} 
if (fstat(fd, &sbuf) < 0) | 
log_msg("job $1d canceled - can't fstat $s: %s", 
jp->jobid, name, strerror(errno)); 
free (jp); 
close (fd); 
continue; 


现在 有 了 要 打印 的 作业 ， 检 查 一 下 配置 文件 有 无 改变 。 锁 住 configlock 互 斥 量 
并 检查 reread 变量 。 如 果 该 值 非 0， 那 么 释放 旧 的 addrinfo 列表 ， 清 空 指针 ， 
解锁 互 斥 量 ， 然 后 调用 init printer 来 重新 初始 化 指针 信息 。 既 然 从 main £X 
程 初始 化 后 只 有 这 个 上 下 文 可 以 查看 并 可 能 更 改 打 印 机 信息 ， 因 此 除了 使 用 
configlock 互 斥 量 来 保护 reread 标志 的 状态 外 , 不 需要 任何 其 他 的 同步 手段 。 
注意 ,尽管 在 此 函数 中 获得 和 释放 两 个 不 同 互 斥 量 ， 但 是 并 没有 同时 持 有 两 个 互 斥 
量 ， 因 此 不 需要 建立 一 个 锁 层 次 〈 见 11.6.2 节 )。 

如 果 不 能 打开 数据 文件 ， 则 记录 出 错 日 志 , 释放 job 结构 ， 然 后 继续 。 打 开 文 件 之 后 ， 
调用 fstat 来 找到 文件 的 大 小 。 如 果 失 败 ， 记 录 出 错 日 志 并 清理 ， 然 后 继续 。 


if ((sockfd = connect retry(AF INET, SOCK STREAM, 0, 
printer-»ai, addr, printer-»ai addrlen)) < 0) { 
log msgí("job td deferred - can't contact printer: $s", 
jp->jobid, strerror(errno)); 
goto defer; 
) 


/* 
* Set up the IPP header. 
*/ 

icp = ibuf; 


hp = (struct ipp hdr *)icp; 

hp-»major version - 1; 

hp-»minor version - 1; 

hp-»operation - htons(OP PRINT, JOB); 

hp-»request, id = htonl(jp-»jobid): 

icp += offsetof(struct ipp hdr, attr group); 

*icp++ = TAG OPERATION ATTR; 

icp = add option(icp, TAG CHARSET, "attributes-charset", 
"utf-8"); 

icp = add option(icp, TAG NATULANG, 
"attributes-natural-language", "en-us"); 

sprintfí(str, "http://$s/ipp", printer name); 

icp = add option(icp, TAG URI, “printer-uri", str); 

icp = add option(icp, TAG NAMEWOLANG, 
"requesting-user-name", jp->req.usernm) ; 


697 
698 


[672—677] 


[678—698] 


699 
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703 
704 
705 
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707 
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711 
712 
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714 
715 
716 
717 
718 
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720 
721 
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724 


[699~708] 
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icp = add option(icp, TAG NAMEWOLANG, "job-name", 


jp-»req.jobnm); 


打开 一 个 连接 到 打印 机 的 流 套 接 字 。 如 果 connect retry 调用 失败 , 跳 到 defer 
处 ， 在 这 里 清理 、 延 迟 一 段 时 间 ， 然 后 再 尝试 。 

接 下 来 ， 建 立 IPP 首部 。 其 操作 是 打印 作业 Cprint-job) WR. EH htons 将 2 字 
节 的 操作 ID 从 主机 转换 为 网 络 字 节 序 ， 使 用 htonl 将 4 字 节 的 作业 ID MEME 
换 为 网 络 字 节 序 。 完 成 首部 的 初始 化 之 后 ， 设 置 标志 值 来 指示 其 后 跟随 操作 属性 。 
调用 add option 将 属性 添加 到 报 文中 。 图 12-5 列 出 了 打印 作业 请 求 所 需 的 操作 
属性 ， 前 3 个 是 必需 的 。 将 字符 集 设 为 UTF-8， 该 字符 集 是 打印 机 必须 支持 的 ， 指 
定语 言 为 en-us， 即 代表 美国 英语 (US. English); 另外 一 个 必需 的 属性 是 URI 
(Uniform Resource Identifier)， 将 其 设 为 http://printer_name/ipp。 

推荐 使 用 requesting-user-name 属性 ， 但 不 是 必需 的 。job-name 属性 也 是 
可 选 的 .print 命令 将 要 打印 的 文件 名 作为 作业 名 发 送 , 该 名 字 能 够 帮助 用 户 区 别 
多 个 要 处 理 的 作业 。 


if {jp->req.flags & PR TEXT) { 


p = "text/plain"; 
extra = 1; 


} else { 


} 


p = "application/postscript"; 
extra = 0; 


icp = add option(icp, TAG MIMETYPE, "document-format", p); 
*icpt+t+ = TAG END OF ATTR; 
ilen = icp - ibuf; 


/* 

* Set up the HTTP header. 
rA 

hep = hbuf; 


sprintf(hcp, "POST /ipp HTTP/1.1\r\n"); 
hcp += strlen(hcp); 
sprintf(hcp, "Content-Length: %id\r\n", 


(long) sbuf.st_size + ilen + extra); 


hcp += strlen (hcp); 

strcpy (hcp, "Content-Type: application/ipp\r\n"); 

hep += strlen(hcp); 

sprintf(hcp, "Host: %s:td\r\n", printer name, IPP PORT); 
hcp += strlen(hcp); 

*hep++ = 'Nr'; 

*hep++ = ‘\n'; 

hlen = hep - hbuf; 


提供 的 最 后 一 个 属性 是 document~format。 如 果 省 略 该 属性 ， 则 假定 文件 格式 
是 打印 机 默认 格式 。 对 于 PostScript 打印 机 ,格式 可 能 是 PostScript, 但 是 一 些 打印 
机 可 以 自动 检测 格式 并 在 PostScript 与 纯 文本 或 PCL CHP 的 打印 机 命令 语言 ) 格 
式 间 做 选择 。 如 果 PR_TEXT 标志 被 设置 ， 则 将 文档 格式 设置 为 text /plain。 fg 
则 ， 设 置 为 application/postscript。 然 后 在 属性 结束 处 用 结束 属性 标志 
界 并 计算 IPP 首部 的 大 小 。 
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[725—735] 


[736—744] 


[745—753] 


整数 extra 用 来 记录 任何 可 能 需要 传输 到 打印 机 的 附加 字符 。 稍 后 会 看 到 ， 需 要 
发 送 一 个 附加 字符 以 能 够 可 靠 地 打印 纯 文本 。 当 要 计算 内 容 长 度 时 ， 需 要 考虑 这 个 
附加 字符 。 
现在 知道 了 IPP 首部 的 大 小 ,可 以 建立 HTTP 首部 .将 Context-Length KA IPP 
首部 的 字 节 长 度 加 上 要 打印 文件 的 大 小 再 加 上 需要 发 送 的 附加 字符 的 长 度 。 
Content-Type 为 application/ipp。 用 回 车 换行 符 结 束 HTTP 首部 。 最 后 ， 
计算 HTTP 首部 的 大 小 。 
/* 
* Write the headers first. Then send the file. 
+y 
iov[0].iov base = hbuf; 
iov[0].iov len = hlen; 
iov[1].iov base - ibuf; 
iov[11.iov len = ilen; 
if (writev(sockfd, iov, 2) t= hlen + ilen) { 
log ret("can't write to printer"); 
goto defer; 
} 


if (jp-»req.flags & PR TEXT) { 
/* 


* Hack: allow PostScript to be printed as plain text. 
g^ 
if (write(sockfd, "Mb", 1) != 1) í 


log_ret ("can’t write to printer"); 
goto defer; 


) 


while ((nr = read(fd, buf, IOBUFSZ)) > O0) | 
if ((nw = writen(sockfd, buf, nr)) != nr) ( 
if (nw « 0) 
log ret("can't write to printer"); 
else 
log msg("short write (%d/%d) to printer", nw, nr); 
goto defer; 
} 
} 


将 iovec 数组 的 第 一 个 元 素 指向 HTTP 首 部， 第 二 个 元 素 指 向 IPP 首部 。 然 后 采 
用 writev 将 两 个 首部 送 往 打印 机 。 如 果 写 失败 或 者 写 入 少 于 请 求 的 字 节 数 ， 则 记 
录 日 志 并 跳 转 到 defer， 在 这 里 清理 并 延迟 一 段 时 间 ， 然 后 再 次 尝试。 

即使 指明 了 纯 文本 ，Phaser 8560 还 是 会 自动 检测 文档 格式 。 为 了 防止 它 识 别 出 要 以 
纯 文 本 格式 打印 的 文件 的 开头 ， 将 退 格 作为 第 一 个 发 送 字 符 ， 这 个 字符 不 会 被 打印 
出 来 ， 并 且 能 够 使 自动 识别 文件 格式 功能 失效 。 这 就 可 以 打印 PostScript 源 文件 而 
不 用 打印 PostScript 文件 的 镜像 。 

通过 LOBUFSZ 块 将 数据 文件 发 往 打 印 机 。 当 套 接 字 缓 冲 区 满 的 时 候 ，write 的 发 
送 少 于 请 求 ， 因 此 可 以 用 write 处 理 这 种 情况 。 当 写 首 部 时 ， 不 必 担 心 这 种 情况 ， 
因为 它们 都 很 小 ， 但 要 打印 的 文件 却 是 很 大 的 。 
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754 if (nr < 0) { 

755 log ret("can't read %s", name); 
756 goto defer; 

757 } 

758 7 

759 * Read the response from the printer. 
760 wf 

761 if (printer status(sockfd, jp)) | 
762 unlink (name); 

763 sprintf (name, “%s/%s/%d", SPOOLDIR, REQDIR, jp->jobid); 
764 unlink(name); 

765 free(jp): 

766 jp = NULL; 

767 } 

768 defer: 

769 close (fd); 

770 if (sockfd >= 0) 

771 close(sockfd); 

772 if (jp != NULL) ( 

773 replace job(jp): 

774 nanosleep(&ts, NULL); 

778 } 

776 } 

777 ) 

778 /* 


779  * Read data from the printer, possibly increasing the buffer. 
780 * Returns offset of end of data in buffer or ~l on failure. 


781 * 
782  * LOCKING: none. 
703  */ 


784 ssize t 
785 readmore(int sockfd, char **bpp, int off, int *bszp) 


[754—757] ” 读 到 文件 末尾 时 ，read 返回 0。 如果 读 失 败 ， 记 录 错 误 信 息 日 志 并 跳 至 defer。 
[7$8 一 767] ”将 文件 发 送 给 打印 机 后 ， 调 用 printer_status 来 读 取 打 印 机 对 于 请 求 的 响应 。 
如 果 成 功 , printer_status 返回 一 个 非 0 值 , 就 可 以 删除 数据 文件 和 控制 文件 。 
然后 释放 job 结构 ， 将 其 指针 设 为 NULL， 然 后 到 达 defer 标签 。 
[768—777] dE defer 标签 处 ， 关 闭 打 开 的 数据 文件 描述 符 。 如 果 套 接 字 描 述 符 是 有 效 的 ， 也 
将 其 关闭 。 如 出 错 ，jp 指向 要 打印 作业 的 作业 结构 ， 这 样 就 可 以 将 作业 放 在 挂 起 
作业 列表 的 头 部 然后 延迟 1 分 钟 。 如 果 成 功 ，jp 为 NULL， 此 时 只 需 回 到 循环 开始 
处 ， 获 得 下 一 个 要 打印 的 作业 。 
[778—785] readmore 函数 用 于 读 取 来 自打 印 机 的 部 分 响应 消息 。 


786 { 

787 ssize_t nr; 

788 char *bp = *bpp; 
789 int bsz -*bszp; 


790 if (off >= bsz) { 
791 bsz += IOBUFSZ2; 
792 if ((bp = realloc(*bpp, bsz)) == NULL) 
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793 log sys("readmore: can't allocate bigger read buffer"); 
794 *bszp =bsz; 

795 *bpp -bp; 

796 ) 

797 if ((nr = tread(sockfd, &bp[off), bsz-off, 1)) > 0) 

798 return(off-4nr); 

799 else 

800 returní(-1); 

801 ) 

802 /* 


803 * Read and parse the response from the printer. Return 1 
804  * if the request was successful, and 0 otherwise. 


805 * 

806 * LOCKING: none. 

807 */ 

808 int 

809 printer status(int sfd, struct job *jp) 

810 { . 

811 int i, success, code, len, found, bufsz, datsz; 
812 int32 t jobid; 

813 ssize t nr; 

814 char *bp, *cp, *statcode, *reason, *contentlen; 


815 struct ipp hdr h; 


816 A* 

817 * Read the HTTP header followed by the IPP response header. 
818 * They can be returned in multiple read attempts. Use the 
819 * Content-Length specifier to determine how much to read. 
820 */ 


[786—801] “如果 到 达 缓 冲 区 尾部 ， 通 过 相应 的 参数 bpp 和 和 bszp 重新 分 配 一 个 大 一 点 的 缓冲 区 
并 返回 该 新 的 缓冲 区 的 起 始 地 址 以 及 缓冲 区 大 小 。 上 述 任何 一 种 情况 下 ， 从 缓冲 区 
已 读数 据 的 末尾 开始 读 取 缓冲 区 所 能 容纳 的 尽 可 能 多 的 数据 。 返 回 相应 的 已 读数 据 
的 新 偏 移 量 。 如 果 read 失败 ， 或 者 超时 ， 返 回 一 1。 

[802—820] printer status 函数 读 取 打 印 机 对 一 个 打印 作业 请 求 的 响应 消息 。 不 知道 打印 机 会 
如 何 响应 : 也 许 会 在 多 个 报 文中 回 送 一 个 响应 ， 也 许 在 一 个 报 文 中 回 送 完整 的 响应 , 或 
者 包括 一 个 中 间 确 认 ， 诸 如 HTTP 100 Continue 报 文 。 需 要 处 理 所 有 的 可 能 性 。 


821 success =0 ; 

822 bufsz -IOBUFSZ; 

823 if ((bp = malloc(IOBUFSZ)) == NULL) 

824 log sys("printer status: can't allocate read buffer"); 


825 while ((nr = tread(sfd, bp, bufsz, 5)) > 0) { 


826 /* 

827 * Find the status. Response starts with "HTTP/x.y" 
828 * so we can skip the first 8 characters. 

829 xy 

830 cp = bp + 8; 

831 datsz -nr; 

832 while (isspace ((int)*cp)) 

833 cp++; 


834 Statcode =cp; 


835 
836 
837 
838 
839 
840 
841 
842 
843 
844 
845 
846 
847 
848 
849 
850 
851 
852 


[821-838] 


[839—844] 


[845—852] 
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while (isdigit((int)*cp)) 


cptt; 

if (cp == statcode) ( /* Bad format; log it and move on */ 
log msg (bp); 

} else { 


*opt+ ="\0'; 
reason =cp; 
while (*cp l= 'WXr' && *cp l= '\n’) 
cp++; 
*cp -'X0'; 
code =atoi(statcode) ; 
if (HTTP_INFO (code) ) 
continue; 
if (!HTTP SUCCESS(code)) | /* probable error: log it */ 
bp[datsz] ='\0'; 
log msg("error: $s", reason); 
break; 
} 
分 配 一 个 缓冲 区 并 读 取 来 自打 印 机 的 数据 , 期望 $ 秒 之 内 有 可 用 的 响应 . 跳 过 HTTP/1 .1 
和 报 文 开始 的 所 有 空格 ， 然 后 是 数字 状态 码 。 如 果 不 是 ， 在 日 志 中 记录 报 文 的 内 容 。 
如 果 在 响应 中 找到 一 个 数字 状态 码 , 将 其 开始 的 非 数 字 字 符 转 换 成 null 字 节 (这 一 
字符 是 某 种 形式 的 空白 )。 接 下 来 是 一 个 表明 原因 的 字符 串 〈 文 本 消息 )。 搜 索 回 车 
或 换行 符 ， 并 采用 null 字 节 结束 文本 字符 串 。 
调用 atoi 函数 将 状态 码 字符 串 转 化 成 一 个 整数 。 如 果 仅 是 提供 信息 的 报 文 ， 将 其 
忽略 并 继续 循环 。 我 们 期 望 看 到 的 要 么 是 成 功 消 息 要 么 是 出 错 消息 。 如 果 得 到 出 错 
消息 ， 记 录 出 错 日 志 并 退出 循环 。 
/* 
* HTTP request was okay, but still need to check 
* IPP status. Search for the Content-Length. 
*/ 
i = cp - bp; 
for (#7) { 
while (*cp != 'C' && *cp != 'c' && i < datsz) ( 
Cptt; 
itt; 
} 
if (i >= datsz) { /* get more header */ 
if ((nr = readmore(sfd, &bp, i, &bufsz)) « O) ( 
goto out; 
) else { 
cp -&bp[i]:; 
datsz *- nr; 


} 


if (strncasecmp(cp, "Content-Length:", 15) == 0) { 
cp += 15; 
while (isspace((int)*ocp)) 
Cprtt; 


contentlen =cp; 
while (isdigit ((int)*cp)) 
cp++? 
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878 *cpt4 ="\0'; 

879 i = cp - bp: 

880 len -atoi(contentlen); 
881 break; 

882 ) else ( 

883 Ccptt; 

884 itt; 

885 ) 

886 } 


[853—870] WR HTTP 请 求 成 功 , 需要 检查 PP RA. 搜索 整个 报 文 直到 找到 Content-Length 
属性 。HTTP 首部 的 关键 字 是 大 小 写 敏感 的 ， 因 此 需要 同时 检查 小 写 和 大 写字 符 。 如 
果 缓 冲 区 空间 耗 尽 ， 需 要 调用 readmore, 通过 它 再 调用 realloc 增加 缓冲 区 大 小 。 
因为 缓冲 区 地 址 可 能 改变 ， 需 要 调整 cp 指向 正确 的 缓冲 区 位 置 。 

[871—886] ”使 用 strncasecmp 函数 进行 大 小 写 敏感 比较 。 如 果 找 到 Content-Length 属性 字 
符 串 ， 就 搜索 它 的 值 。 将 数字 字符 串 转 换 为 整数 并 退出 这 个 for 循环 。 如 果 比 较 失 败 ， 
继续 逐个 字 节 搜索 缓冲 区 。 如 果 直 到 缓冲 区 末尾 仍 未 找到 Content-Length 属性 ， 


就 从 打印 机 读 取 更 多 数据 并 继续 搜索 。 
887 if (i >= datsz) { /* get more header */ 
888 if ((nr = readmore(sfd, &bp, i, &bufsz)) < 0) { 
889 goto out; 
890 ) else ( 
891 cp =&bp[il]; 
892 datsz += nr; 
893 } 
894 } 
895 found =0 ; 
896 while (!found) | /* look for end of HTTP header */ 
897 while (i < datsz ~ 2) I 
898 if (*cp == An && *(cp + 1) == ‘\r’ && 
899 * (cp + 2) == 'Mn') { 
900 found -1 ; 
901 cp += 3; 
902 i += 3; 
903 break; 
904 } 
905 cpt; 
906 i++; 
907 } 
908 if (i >= datsz) { /* get more header */ 
909 if ((nr = readmore(sfd, &bp, i, &bufsz)) < 0) { 
910 goto out; 
911 } else { 
912 cp =ábp[i]; 
913 datsz += nr; 
914 ) 
915 } 
916 } 
917 if (datsz - i < len) (| /* get more header */ 
918 if ((nr = readmore(sfd, &bp, i, &bufsz)) < 0) { 


919 goto out; 
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920 ) else { 
921 cp =&bp[i]; 
922 datsz += nr; 


[887—916] ”现在 知道 报 文 的 长 度 了 (通过 Content-Length 属性 )。 如 果 耗 尽 缓冲 区 ， 那 么 
从 打印 机 再 次 读 取 。 接 下 来 搜索 HTTP 首部 的 末尾 〈 空 白 行 )。 如 果 找 到 了 ， 就 设 
€ found 标志 并 跳 过 空白 行 。 无 论 何 时 调用 readmore, 都 要 将 cp 设置 为 与 之 前 
指向 的 缓冲 区 偏 移 量 相同 ， 以 防止 重 分 配 时 缓冲 区 地 址 改变 。 

[917—922] ”如果 找到 HTTP 首部 的 末尾 , 计算 HTTP 首部 所 用 的 字 节 数 。 如 果 读 取 的 值 减 去 HTTP 
首部 的 大 小 后 不 等 于 IPP 报 文 的 数据 长 度 《 该 值 从 内 容 长 度 Content-Length 中 计 


算 )， 和 需要 读 取 更 多 的 数据 。 
923 } 
924 } 
925 memcpy (&h, cp, sizeof) (struct ipp hdr); 
926 i = ntohs(h.status); 
927 jobid = ntohl(h.request id); 
928 if (jobid !- jp-»jobid) I 
929 [* 
930 * Different jobs. Ignore it. 
931 aS 
932 log msg("jobid %d status code %d", jobid, i); 
933 break; 
934 } 
935 if (STATCLASS OK(i)) 
936 success - i; 
937 break; 
938 } 
939 } 
940 out: 
941 free (bp); 
942 if inr < 0) f 
943 log msg("jobid %d: error reading printer response: $s", 
944 jobid, strerror(errno)); 
945 } 
946 return (success); 


947 } 
[023—927] ”从 IPP 首部 中 获取 状态 和 作业 ID。 两 者 均 以 网 络 字 节 序 的 整数 形式 存储 ， 因 此 需 
要 调用 ntohs 和 ntohl 将 其 转换 为 主机 字 节 序 。 
[028—939] ”如 果 作 业 ID 不 匹配 ， 表 明 并 非 是 对 我 们 请 求 的 响应 ， 那 么 记录 日 志 并 退出 外 层 
while 循环 。 如 果 IPP 状态 指示 为 成 功 ， 保 存 返回 值 并 退出 循环 。 
[940—947] ”在 退出 之 前 ， 要 释放 用 来 存放 响应 报 文 的 缓冲 区 。 如 果 打 印 请 求 成 功 则 返回 1， 否 则 
失败 ， 返 回 0。 
这 里 总 结 本 章 中 这 个 扩展 的 例子 。 本 章 中 的 程序 在 Xerox Phaser 8560 网 络 PostScript 打印 机 
上 测试 。 遗 憾 的 是 ， 当 文档 格式 设置 为 text/plain 时 ， 这 个 打印 机 并 没有 禁止 它 的 自动 识别 
格式 功能 。 我 们 使 用 了 一 个 小 技巧 ， 使 得 在 想 要 以 纯 文本 格式 对 待 一 个 文档 时 ， 打 印 机 不 自动 识 
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别 文档 格式 。 一 种 替代 的 方法 是 使 用 诸如 a2ps(1) 这 样 的 实用 工具 将 源 打 印 成 一 个 PostScript 程 
序 。a2ps(1) 可 以 在 打印 前 封装 PostScript 程序 。 


21.6 小结 


本 章 仔细 考查 了 两 个 完整 的 程序 ， 一 个 打印 假 脱 机 守护 进程 将 作业 发 送 到 网 络 打印 机 和 一 个 


命令 行程 序 将 打印 作业 提交 到 假 脱 机 守护 进程 。 这 给 我 们 一 个 机 会 ， 考查 在 一 个 实际 程序 中 使 用 
前 面 章节 所 讲述 的 许多 特性 ， 如 线程 、LO 多 路 技术 、 文 件 WO、 套 接 字 IO 以 及 信号 。 


习题 


21.1 


将 ipp.h 中 所 列 的 PP 错误 码 转换 成 错误 消息 。 然 后 修改 打印 假 脱 机 守护 进程 ， 当 IPP 首 
部 指示 有 打印 机 错误 时 ， 在 printer status 函数 结尾 处 记录 日 志 。 

增强 print 命令 和 printd 守护 进程 ， 使 得 用 户 可 以 请 求 双 面 打印 ， 并 支持 横向 打印 和 纵 
向 打印 。 

修改 打印 假 脱 机 守护 进程 ， 当 其 开始 时 ， 能 够 联系 打印 机 并 找 出 所 文 持 的 特性 ， 这 样 守护 
进程 就 不 会 请 求 打印 机 不 支持 的 选项 。 

写 一 个 命令 行程 序 来 报告 挂 起 的 打印 作业 状态 。 

写 一 个 命令 行程 序 来 取消 一 个 挂 起 的 打印 作业 。 使 用 作业 ID 作为 命令 参数 来 指明 取消 哪个 
作业 。 如 果 防 止 一 个 用 户 取消 另 一 个 用 户 的 打印 作业 ? 

在 打印 假 脱 机 守护 进程 中 支持 多 个 打印 机 ， 并 包括 将 一 个 打印 作业 从 本 打印 机 移 到 另 一 个 
打印 机 的 方式 。 

解释 为 什么 在 打印 机 守护 进程 中 ， 当 信号 处 理 线程 捕捉 到 SIGHUP 并 将 reread 设置 为 1 
时 ， 不 需要 唤醒 打印 机 线程 ? 

在 printer status 函数 中 , 通过 查找 HTTP 的 Content-Length 属性 搜索 IPP 报 文 的 
长 度 。 这 一 技术 在 使 用 块 传输 编码 的 打印 机 上 不 起 作用 。 在 RFC 2616 中 查找 块 消息 是 如 何 
格式 化 的 ， 然 后 修改 printer_status， 使 其 也 能 够 支持 这 种 形式 的 响应 。 

在 update_jobno 函数 中 ， 当 下 一 个 作业 编号 从 最 大 正 值 回 绕 到 1 时 《参见 get_newjobno), 
可 能 会 将 一 个 较 大 的 编号 改写 为 一 个 较 小 的 编号 。 这 可 能 导致 守护 进程 重启 时 读 到 一 个 错 
误 的 编号 。 对 于 这 一 问题 是 否 有 简单 的 解决 方法 ? 
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本 附录 包含 了 正文 中 说 明 过 的 标准 ISO C. POSIX 和 UNIX 系统 的 函数 原型 。 通 常 我 们 想 了 
解 的 是 函数 的 参数 (fgets 的 哪 一 个 参数 是 文件 指针 ? ) 或 者 返回 值 (sprintf 返回 的 是 指针 
还 是 计数 值 ? )。 这 些 函 数 原型 还 说 明了 要 包含 哪些 头 文件 ， 以 获得 特定 常量 的 定义 ， 或 获得 ISO 
C 函数 原型 ， 以 帮助 在 编译 时 进行 错误 检测 。 

每 个 函数 原型 的 引用 页 号 出 现在 为 该 函数 列 出 的 第 一 个 头 文件 的 右边 。 引 用 页 号 提供 的 是 包 
含 该 函数 原型 的 页 。 为 获得 该 函数 原型 的 附加 信息 可 参阅 该 页 。 

某 些 函 数 原 型 仅 受 本 书 说 明 的 4 种 平台 中 某 几 种 的 支持 。 另 外 ， 某 些 平 台 支 持 的 函数 标志 在 
另 一 些 平台 上 并 不 提供 支持 。 对 于 这 些 情况 , 我 们 通常 列 出 提供 支持 的 平台 。 FIESTA EB, 
我 们 列 出 了 不 提供 支持 的 平台 。 


本 附录 中 标注 的 页 码 为 英文 版 原 书 的 页 码 ， 与 书 中 页 边 标 注 的 页 码 对 应 。 


void abort (void); 
<stdlib.h> p. 365 
此 函数 不 返回 值 


int accept (int sockld, struct sockaddr *restrict addr, 
socklen t *restrict iem); 
<sys/socket.h> p. 608 
BEHA: BRD, BEX BRS) 描述 符 ; 若 出 错 则 返回 -1 


int access(const char *path, int mode); 
<unistd.h> p. 102 
mode: R OK. W OK. X OK. F OK 
返回 值 : 若 成 功 ， 返回 0; 车 出 错 ， 返回 -1 


int aio cancel(int fd, struct aiocb *aiocb); 
«aio.h» p. 514 
j&[RMÉ: AIO ALLDONE. AIO CANCELED. AIO NOTCANCELED; 车 出 错 ， 返 回 -1 
int aio error(const struct aiocb *aiocb); 
<aio.h> p. 513 


BEHE: 若 操作 成 荔 ， 返 回 0， 若 操作 仍 在 进行 中 ， 返 回 BINPRCOGRESS: 若 操 
作 失 败 ， 返 回 错误 码 ， 若 出 错 ， 返 回 -1 


int aio fsync(int op, struct aiocb *aiocb); 
<aio.h> P. 513 
返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 

int aio read(struct aiocb *aiocb): 
«aio h» p. 512 


返回 值 : FRH, BE 0; 若 出 错 则 返回 -1 


ssize t aio return(const struct aiocb *aíocb); 


int 


int 


unsigned 
int 


int 


int 


void 


speed t 


speed t 


int 


int 


int 


int 


int 


void 


int 
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<aio. h> 


返回 值 : 异步 操作 的 结果 考 出 错 ， 返 回 -1 


aio suspend(const struct aiocb *const /ist[], int nent, 
const struct timespec *timeout); 
<aio.h> 


返回 值 : HR, Eo 若 出 错 ， 返 回 -~! 


aio write(struct aiocb *aiocb); 
<aio. h> 


返回 值 : ERD. elo: Sw. IRI! 


alarm(unsigned int seconds); 
«unistd.h» 


返回 值 : 0 RANEA PROT (Rl E 


atexit (void (*func) (void) ); 
<stdlib.h> 
返回 值 ， 若 成 功 ， 返 回 FHH, BEE o 


bind(int sockfd, const struct sockaddr *addr, socklen t len); 


<sys/socket.h> 


返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


*calloc(size t nobj, size t size); 
«stdlib.h» 
返回 值 : 若 成 功 ， 返 回 非 空 指针 ， 若 出 错 ， 返 回 NULL 


cfgetispeed (const struct termios *fermptr); 
«termios.h» 


返回 值 : 返回 波 特 率 值 


cfgetospeed(const struct termios *fermptr); 
<termios.h> 


返回 值 ， 返 回 波 特 率 值 


cfsetispeed(struct termios *fermptr, speed t speed); 
<termios.h> 


BE: FRH, Eeo FHE, Be- 


cfsetospeed(struct termios *fermptr, speed t speed); 
<termios.h> 


BEE: FRH, EO: Fi, ge- 


chdir (const char *path); 
<unistd.h> 


返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -! 


chmod(const char *path, mode t mode); 
«sys/stat.h» 
mode: S 1S[UG]ID. S ISVTX. 
S I[RWX] (USR|GRP|OTH) 
RE: FRH, EO; SH, 8e- 


chown (const char *pafh, uid t owner, gid t group): 
«unistd.h» 


返回 值 : ERI., 返回 0; zu). 返回 -1 


clearerr(FILE *fp); 
«stdio.h» 


clock getres(clockid t clock id, struct timespec *ésp); 


p. 513 


p.514 


p. 512 


p. 338 


p. 200 


p. 604 


p. 207 


p. 692 


p. 692 


p. 692 


p. 692 


p. 135 


p. 106 


p. 109 


p. 151 


int 


int 


int 


int 


int 


void 


unsigned 


char 


struct 
cmsghdr 


unsigned 
int 


struct 
cmsghdr 
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<sys/time.h> 

clock id: CLOCK_REALTIME, CLOCK_MONOTONIC, 
CLOCK PROCESS CPUTIME ID. 
CLOCK THREAD, CPUTIME ID 

返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 --1 


clock gettime (clockid t clock id, struct timespec *fsp); 
<sys/time.h> 
clock id: CLOCK REALTIME. CLOCK_MONOTONIC. 
CLOCK PROCESS CPUTIME ID. 
CLOCK THREAD CPUTIME ID 
返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


clock nanosleep(clockid t clock id, int flags, 
const struct timespec *regip, 
structtimespec *remip); 
«time.h» 
clock id: CLOCK REALTIME. CLOCK MONOTONIC. 
CLOCK PROCESS CPUTIME ID. 
CLOCK THREAD CPUTIME ID 
flags: TIMER ABSTIME 
BEE: BMRB ZORA, REO; 若 失 败 ， 返 回 错误 码 


clock settime(clockid t clock id, const struct timespec *tsp): 
«sys/time.h» 
clock id: CLOCK REALTIME. CLOCK MONOTONIC, 
CLOCK PROCESS CPUTIÍME ID. 
CLOCK THREAD CPU'TIME ID 


WEN: 若 成 功 ， 返 回 0; 若 出 错 ， 返 加 -1 


close(int fd); 
<unistd.h> 


RA: HRI, 8E 0: 若 出 错 ， 返 回 -1 


closedir(DIR *dp); 
«dirent.h» 


返回 值 ; ERI, 返回 0; 车 出 错 ， 返回 -1 


closelog(void); 
<syslog.h> 


*CMSG DATA(struct cmsghdr *cp); 
«sys/socket.h» 


返回 值 ， 一 个 指针 ， 指 向 与 cmsghdr 结构 相关 联 的 数据 


*CMSG FIRSTHDR(struct msghdr *mp); 
«sys/socket.h» 





p. 190 


p. 189 


p.375 


p. 190 


p. 66 


p. 130 


p. 470 


p. 645 


p. 645 


返回 值 : 一 个 指针 ， 指 向 与 msghdr 结构 相关 联 的 第 一 个 cmsghdr BY; E 


无 这 样 的 结构 ， 返 回 NULL 


CMSG LEN(unsigned int nbytes); 
«sys/socket.h» 


BEHA: JM nbytes 长 的 数据 对 象 分 配 的 长 度 


*CMSG NXTHDR(struct msghdr *mp, struct cmsghdr *cp); 
<sys/socket.h> 


返回 值 : 一 个 指针 ， 指 向 与 msghdr 结构 相关 联 的 下 一 个 msghdr 结构 , 该 msghdr 


p. 645 


p. 645 
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int 


int 


char 


int 


int 


int 


void 


void 


void 


void 


void 


void 


void 


int 


int 


int 


结构 给 出 了 当前 的 cmsghdr 结构 ， 若 当前 cmsghdr 结构 已 是 最 后 一 
个 ， 返 回 NULL 


connect (int sockd, const struct sockaddr *addr, 
socklen t len; 
«sys/socket.h» p. 605 
返回 值 : A BE. 返回 0; 若 出 错 ， 返回 -1 


creat (const char *path, mode t mode); 
<fentl.h> p. 66 
mode: S IS[UG] ID. S ISVTX. 
S_I [RWX] (USR|GRP|OTH) 
返回 值 ， 若 成 功 ， 返 回 为 只 写 打 开 的 文件 描述 符 ; 车 出 错 ， 返 回 -1 


*ctermid(char *ptr); 


<stdio.h> p. 694 
返回 值 ， 若 成 功 ， 返 回 指向 控制 终端 名 的 指针 ， 若 出 错 ， 返 回 措 向 空 字符 串 的 
指针 
dprintf(int fd, const char *restrict format, ...); 
<stdio.h> p. 159 


返回 值 ， 若 成 功 ， 返 回 输出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


dup (int fd); 
«unistd.h» i p. 79 
返回 值 ， 若 成 功 ， 返 回 新 的 文件 描述 符 ， 若 出 错 ， 返 回 -1 


dup2(int fd, int fd2): 
«unistd.h» p. 79 
返回 值 ， 若 成 功 ， 返 回 新 的 文件 描述 符 ， 若 出 错 ， 返 回 -1 


endgrent (void): 


<grp.h> p. 183 
endhostent (void) ; 

«netdb.h» p. 597 
endnetent (void); 

«netdb.h» p. 598 
endprotoent (void); 

«netdb.h» p. 598 
endpwent (void); 

<pwd.h> p. 180 


endservent (void); 
<netdb.h> p. 599 


endspent (void); 
<shadow.h> p. 182 
平台 : Linux 3.2.0. Solaris 10 


execl (const char “path, const char *argü, ... /* (char *) 0 */ ); 
<unistd.h> p. 249 
返回 值 ， 若 出 错 ， 返 回 -1， 车 成 功 ， 不 返回 


execle(const char *path, const char *arg0, ... /* (char *) 0, 
char *const emvp{] */ )? 
<unistd.h> p. 249 
返回 值 ， 若 出 错 ， 返 回 -1; 车 成 功 ， 不 返回 


execlp (const char *filename, const char *arg0, ... 
/* (char *) 0 */ ): 


int 


int 


int 


void 


void 


void 


int 


int 


int 


int 


int 


int 


«unistd.h» 


BEH: FW, AE- ERW, FEE 


execv(const char *path, char *const argv[]); 
«unistd.h» 


AMA: dne. BE- 车 成 功 ， 不 返回 


execve (const char *path, char *const argv[], 
char *const empi]): 
«unistd.h» 


返回 值 ， 基 出错， 返回 -1; 若 成 功 ， 不 返回 


execvp (const char *filename, char *const argv[]): 


«unistd.h» 

iR [HHÉ: 若 出 错 ， 返回 -1; Xm. 不 返回 
_Exit (int status); 

<stdlib.h> 

这 个 函数 从 不 返回 
.exit(int síatus); 


<unistd.h> 


这 个 函数 从 不 返回 


exit(int status) ; 
<stdlib.h> 
这 个 函数 从 不 返回 
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p. 249 


p. 249 


p. 198 


p. 198 


faccessat(int fd, const char *path, int mode, int flag); 


«unistd.h» 

mode: R OK. W OK. X OK. F OK 

flag: AT EACCESS 

REH: 若 成 功 ， 返 回 0; AHH. BEA 


fchdir(int fd); 
«unistd.h» 


返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


fchmod(int fd, mode t mode); 
<sys/stat.h> 
mode: S IS[UG]ID. S_ISVTX, 
S I[RWX] (USR|GRP| OTH) 
返回 值 : AR. lO; 车 出 错 ， 返 回 -1 


p. 102 


p. 135 


p. 106 


fchmodat(int fd, const char *path, mode t mode, int flag); 


<sys/stat.h> 
mode: S_IS{UG]ID, S ISVTX, 
S I[RWX] (USR|GRP|OTH) 
flag: AT SYMLINK NOFOLLOW 
返回 值 : 车 成 功 ， 返 回 Fu, gE- 


fchown(int fd, uid t owner, gid t group); 
<unistd.h> 


返回 值 : X HI, 返回 0; 若 出 错 ， 返回 -1 


fchownat(int fd, const char *path, uid t owner, 
gid tgroup, int flag); 
«unistd.h» 
flag: AT SYMLINK NOFOLLOW 
返回 值 : 若 成 功 ， 返 回 0; FR, wE- 


p. 106 


p. 109 


p. 109 
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int 


int 


int 


void 


int 


FILE 


DIR 


void 


void 


int 


int 


int 


int 


int 


int 


char 


函数 原型 


fclose(FILE *fp): 


<stdio.h> 

返回 值 ， 若 成 功 ， 返 回 0; BH, BA EOF 
fcntl(int fd, int cmd, ... /* int arg */ ): 

«fcntl.h» 


cmd: F DUPFD. F DUPFD CLOEXEC. F GETFD. 
F SETFD. F GETFL. F SETFL. F. GETOWN, 
F SETOWN. F GETLK. F SETLK. F_SETLKW 

返回 值 : AR, KR cmd; 若 出 错 ， 返 回 -1 


fdatasync(int fd); 
<unistd.h> 
返回 值 ， 车 成 功 ， 返 回 0， 若 出 错 ， 返 回 --1 
平台 : Linux 3.2.0. Solaris 10 


FD CLR(int fd, fd set *fdset); 
<sys/select.h> 


FD ISSET(int fd, fd set “fdsef); 
<sys/select.h> 


返回 值 ， FeUERRARP, AEC: BM. 2E o0 


*fdopen(int fd, const char *fype); 
<stdio.h> 
type: "r". "aU n "aU. "rU. Nw+"、 "a4." 


返回 值 ， 若 成 功 ， 返 回 文件 指针 ;， 若 出 错 ， 返 回 NULL 


*f£dopendir (int fd); 
«dirent.h» 


返回 值 ， 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


FD SET(int fd, fd set *fdset); 
<sys/select.h> 


FD ZERO(fd set *fdset); 
<sys/select.h> 


feof (FILE *fp); 
<stdio.h> 


p. 150 


p. 82 


p. 81 


p. 503 


p. 503 


p. 148 


p. 130 


p. 503 


p. 503 


p. 151 


返回 值 ， 若 到 达 流 的 文件 尾 端 ， 返 回 非 (GO: Bil, REO CHD) 


ferror(FILE *fp); 
«stdio.h» 


AMA: 若 流出 错 ， 返 回 非 0〈 真 )》;， BR. iO CR) 


fexecve(int fd, char *const argv[], char *const emvp[])):; 
«unistd.h» 


返回 值 ， 若 出 错 ， 返 回 -1; 若 成 功 ， 不 返回 值 


fflush(FILE *fp); 
«stdio.h» 


返回 值 : 若 成 功 ， 返 回 0， 车 出 错 ， 返 回 EOF 


fgetc(FILE *fp); 
<stdio.h> 


返回 值 ， 若 成 功 ， 返 回 下 一 个 字符 ， 若 已 到 达 文 件 尾 端 或 出 错 ， 返 


fgetpos (FILE *restrict fp, fpos t *restrict pos); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 0; 车 出 错 ， 返 回 非 0 


*fgets(char *restrict buf, int n, FILE *restrict fp); 


p. 151 


p. 249 


p.147 


p. 150 


[E] EOF 


p.158 


int 


void 


FILE 


FILE 


pid t 


long 


int 


int 


int 


size t 


void 


void 


FILE 
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<stdio.h> 


返回 值 : FRH, BE byf 若 已 到 达 文 件 昆 端 或 出 错 ， 返 回 NULL 


fileno(FILE *fp); 
<stdio.h> 


返回 值 ， 与 该 流 相 关联 的 文件 描述 符 ， 若 出 错 ， 返 回 -1 


flockfile(FILE *fp); 
<stdio.h> 


*fmemopen(void «restrict buf, size_t size, 
const char *restrict type); 
<stdio.h> 
type: "r", "w", "a", "re", "wr", “at 


返回 值 ， 车 成 功 ， 返 回流 指针 ;， 若 错误 ， 返 回 NULL 


*fopen(const char *restrict path, const char *restrict type); 
<stdio.h> 
type: I ys "uw". "aU "rA". "WU. "a," 


返回 值 ， 若 成 功 ， 返 回 文件 指针 ; 若 出 错 ， 返 回 NULL 


fork(void); 
<unistd.h> 


p. 152 


p. 164 


p. 443 


p. 171 


p. 148 


p.229 


返回 值 ， 若 在 子 进程 中 ， 返 回 0; 若 在 父 进程 中 ， 返 回 子 进程 DD， 车 出 错 ， 返 回 -1 


fpathconf (int fd, int mame); 

«unistd.h» 

name: PC ASYNC IO. PC CHOWN RESTRICTED. 
.PC FILESIZEBITS. PC LINK, MAX. 
PC MAX CANON. PC MAX INPUT. 
PC NAME MAX. PC NO TRUNC. PC PATH MAX, 
.PC PIPE BUF. PC PRIO IO. PC SYMLINK MAX. 
.PC SYNC IO. PC TIMESTAMP RESOLUTION. 
PC 2 SYMLINKS. PC VDISABLE 

返回 值 ， 若 成 功 ， 返 回 相 应 值 ， 若 出 错 ， 返 回 -1 


fprintf (FILE *restrict fp, const char *restrict format, ...); 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回 输出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


fputc(int c, FILE *fp); 
«stdio.h» 


BMA: 车 成 功 ， 返 回 c; AH, RE EOF 


fputs(const char *restrict str, FILE *restrict fp); 
<stdio.h> 


返回 值 : 若 成 功 ， 返回 非 负 值 ; 车 出 错 ， 返回 EOF 


fread(void *restrict pir, size t size, size t nobj, 
FILE *restrict fp): 
<stdio.h> 
返回 值 ， 读 的 对 象 数 
free(void *ptr); 


<stdlib.h> 


freeaddrinfo(struct addrinfo *ai); 
<sys/socket.h> 
<netdb.h> 


p. 42 


p. 152 


p. 153 


p. 156 


p. 207 


p. 599 


*freopen (const char *restrict path, const char *restrict fye, FILE *restrict fp); 


«stdio.h» 


p. 148 


[855 | 
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int 


int 


int 


int 


int 


int 


int 


long 


off t 


key t 


int 


int 


void 


int 


int 


type: "yn". "yt. "a". "rt". "nut". "a" 


返回 值 ， 若 成 功 ， 返 回 文 件 指针 ; 若 出 错 ， 返 回 NULL 


fscanf(FILE *restrict fp, const char *restrict format, ...); 
<stdio.h> p. 162 
返回 值 ， 赋值 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 转换 前 已 到 达 文 件 尾 端 ， 返 回 EOF 


fseek(FILE *fp, long offset, int whence): 
<stdio.h> p. 158 
whence: SEEK SET. SEEK CUR. SEEK END 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


Eeeeke (FILE *fp, off t offset, int whence); 
<stdio.h> p. 158 
whence: SEEK SET. SEEK CUR. SEEK END 
返回 值 ; TOR. 返回 0; 车 出 错 ， 返回 -1 


fsetpos(FILE *fp, const fpos t *pos); 
<stdio.h> p. 158 


fstat(int fd, struct stat *buf): 
<sys/stat.h> p. 93 


fstatat(int fd, const char *restrict path, 
struct stat *restrict bwf, int flag); 
«sys/stat.h» p. 93 
flag: AT SYMLINK NOFOLLOW 
IRMA: FARO: 返回 0; 车 出 错 ， 返 回 -1 


fsync(int fd); 
<unistd.h> p. 81 
EMA: BR, RE 若 出 错 则 返回 -1 


ftell(FILE *fp); 
<stdio.h> p. 158 
返回 值 ， 若 成 功 ， 返 回 当前 文件 位 置 指示 器 ; 车 出 错 ， 返 回 -1L 


ftello(FILE */p); 
<stdio.h> p. 158 
返回 值 ， 车 成 功 ， 返 回 当前 文件 位 置 指示 器 ， 车 出 错 ， 返 回 (off_t) -1 


ftok {const char *path, int id); 
«sys/ipc.h» p. 557 
返回 信 :， 若 成 功 ， 返 回 键 ; 若 出 错 ， 返 回 (key_t) -1 


ftruncate(int fd, off t length); 
«unistd.h» p. 112 
RE: SRW, BHO; 若 出 错 ， 返 回 -1 


ftrylockfile(FILE *fp):; 
<stdio.h> p. 443 
返回 值 ， 若 成 功 ， 返 回 0， 若 不 能 获取 锁 ， 返 回 非 0 数值 


funlockfile(FILE *fp); 
<stdio.h> p. 443 


futimens(int fd, const struct timespec iimes[2]); 
<sys/stat.h> p. 126 
EA: BRU. BAO; 若 出 错 ， 返 回 -1 


fwide(FILE *fp, int mode); 


size t 


int 


int 


int 


int 


char 


gid t 


char 


uid t 


gid t 


struct 
group 
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<stdio.h> p. 144 

«wchar.h» 

BA: RARER, BAER: 车 流 是 字 节 定向 的 ， 返 回 负 值 ， 若 流 是 
未 定向 的 ， 返 回 0 


fwrite(const void *restrict pir, size_t size, size t nobj, 
FILE *restrict fp); 
<stdio.h> p. 156 
返回 值 ， 写 的 对 象 数 


*gai strerror(int error); 
«netdb.h» p. 600 
返回 值 : 指向 描述 错误 的 字符 串 的 指针 


getaddrinfo(const char *restrict host, const char *restrict service, 
const struct addrinfo *restrict hint, 
struct addrinfo **restrict res); 
<sys/socket.h> p. 599 
«netdb.h» 


返回 值 ， 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 非 0 错误 码 


getc(FILE *fp); 
<stdio.h> p. 150 
BEA: 若 成 功 ， 返 回 下 一 个 字符 ; 若 已 到 达 文 件 尾 端 或 出 错 ， 返 回 EOF 


getchar (void); 
«stdio.h» p. 150 
返回 值 ， 若 成 功 ， 返 回 下 一 个 字符 : 车 已 到 达 文 件 尾 端 或 出 错 ， 返 回 EOF 


getchar unlocked (void); 
<stdio.h> p. 444 
RAE: HR, BAF-TSH: 若 已 到 达 文 件 尾 或 者 出 错 ， 返 回 EOF 


getc unlocked(FILE *fp); 
«stdio.h» p. 444 
返回 值 ， 若 成 功 ， 返 回 下 一 个 字符 ， 若 已 到 达 文 件 尾 或 者 出 错 ， 返 回 EOF 


*getcwd(char *buf, size t size); 
<unistd.h> p. 136 
返回 值 ， 若 成 功 ， 返 回 by FH, BE NULL 

getegid(void); 
<unistd.h> p. 228 
返回 值 : 调用 进程 的 有 效 组 ID 


*getenv(const char *name); 
<stdlib.h> p. 210 
返回 值 ， 指 向 与 name 关联 的 value 的 指针 ; RARR, IRE] NULL 


geteuid (void); 
«unistd.h» p.228 
返回 值 ， 调 用 进程 的 有 效用 户 ID 


getgid(void); 
<unistd.h> p. 228 
返回 值 ， 调 用 进程 的 实际 组 ID 


*getgrent (void); 
«grp.h» p. 183 
返回 值 ， 若 成 功 ， 返 回 指针 ， 若 出 错 或 到 达 文 件 尾 端 ， 返 回 NULL 


struct 
group 


struct 
group 


int 


struct 
hostent 


int 


char 


int 


struct 
netent 


struct 
netent 


struct 
netent 


int 


int 
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*getgrgid(gid t gid); 
<grp.h> p. 182 
返回 值 : 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


*getgrnam(const char *name); 
<grp.h> p. 182 
返回 值 ， 若 成 功 ， 返 回 指针 ; 车 出 错 ， 返 回 NULL 


getgroups (int gidsetsize, gid t grouplist[]); 
<unistd.h> p. 184 
返回 值 ， 若 成 功 ， 返 回 附 属 组 ID 数量 ， 若 出 错 ， 返 回 -1 


*gethostent (void); 
<netdb.h> p. 597 
EM: 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


gethostname (char *name, int namelen); 
<unistd.h> p. 188 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


*getlogin (void) ; 
<unistd.h> p. 275 
返回 值 ， 若 成 功 ， 返 回 指向 登录 名 字符 串 的 指针 ， 若 出 错 ， 返 回 NULL 


getnameinfo(const struct sockaddr *restrict addr, 
Socklen t alen, char *restrict host, 
Socklen t hostlen, char *restrict service, 
Socklen t servlen, unsigned int flags); 
«sys/socket.h» p. 600 
<netdb.h> 
flags: NI DGRAM. NI NAMEREQD. NI NOFQDN. 
NI NUMERICHOST. NI NUMERICSCOPE. 
NI NUMERICSERV 
返回 值 ， 著 成功， 返回 0， 若 出 错 ， 返 回 非 0 值 


*getnetbyaddr(uint32 t met, int type); 
«netdb.h» p. 598 
返回 值 : 若 成 功 ， 返 回 指针 ; 者 出 错 ， 返 回 NULL 


*getnetbyname (const char *name); 
<netdb.h> p. 598 
返回 值 : 若 成 功 ， 返 回 指针 ; 著 出 错 ， 返 回 NULL 


*getnetent (void) ; 
<netdb.h> p. 598 
EME: RT, BEHS: BS, RE) NULL 


getopt (int argc, char * const argv[]1, const char *options) ; 
«fcntl.h» p. 662 
extern int opterr, optind, optopt; 
extern char *optarg; 


返回 值 ， 下 一 个 选项 字符 ; 若 所 有 选项 被 处 理 完 ， 返 回 -! 


getpeezname (int sockd, struct sockaddr *restrict addr, 
socklen t *restrict alenp); 


pid t 


pid t 


pid t 


pid t 


int 


struct 
protoent 


struct 
protoent 


struct 
protoent 


struct 
passwd 


struct 
passwd 


struct 
passwd 


int 
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«sys/socket.h» 


返回 值 ， 若 成 功 ， 返 回 0: 若 出 错 ， 返 回 -1 


getpgid (pid t pid); 
<unistd.h> 


返回 值 : Se, BARA ID; SW. GRISI-I 


getpgrp (void); 
<unistd.h> 


返回 值 : 调用 进程 的 进程 组 ID 


getpid (void); 
<unistd.h> 


返回 值 : 调用 进程 的 进程 ID 


getppid (void); 
<unistd.h> 


返回 值 : 调用 进程 的 父 进程 D 


getpriority(int which, id t who); 
<sys/resource.h> 
which: PRIO_PROCESS. PRIO_PGRP. PRIO_USER 


返回 值 ， 若 成 功 ， 返 回 -NZERO~NZERO-1 的 nice fA; 车 出 错 ， 返 回 -1 


*getprotobyname (const char *name); 
<netdb.h> 
返回 值 : 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 


*getprotobynumber (int proto); 
<netdb.h> 
返回 值 ， 若 成 功 ， 返 回 指针 ; 若 出 错 ， 返 回 NULL 


*getprotoent (void); 
«netdb.h» 
BEE: ERY, BEHE: 若 出 错 ， 返 回 NULL 


*getpwent (void); 
«pwd.h» 


返回 值 : 车 成 功 ， 返 回 指 针 ， 若 出 错 或 到 达 文 件 尾 端 ， 返 回 NULL 


*getpwnam(const char *name); 
«pwd.h» 
返回 值 ， 若 成 功 ， 返 回 指针 ， 车 出 错 ， 返 回 NULL 


*getpwuid(uid t wid): 
<pwd.h> 
返回 值 ， 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 


getrlimit(int resource, struct rlimit *ripir); 
<sys/resource.h> 
resource: RLIMIT_CORE, RLIMIT_CPU, 
RLIMIT_DATA, RLIMIT_FSIZE, 
RLIMIT NOFILE, RLIMIT STACK, 
RLIMIT AS (FreeBSD 8.0. Linux 3.2.0. 
Solaris 10) , 


RLIMIT MEMLOCK (FreeBSD 8.0. Linux 3.2.0. 


p. 605 


p.294 


p. 293 


p. 228 


p. 228 


p. 277 


p. 598 


p. 598 


p. 598 


p. 180 


p.179 


p.179 


p. 220 
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Char 


struct 
servent 


struct 
servent 


struct 
servent 


pid t 


int 


int 


struct 
spwd 


struct 
spwd 


int 


Mac OS X 10.6.8) , 
RLIMIT MSGQUEUE (Linux 3.2.0) , 
RLIMIT NICE (Linux 3.2.0) , 
RLIMIT NPROC (FreeBSD 8.0. Linux 3.2.0. 
Mac OS X 10.6.8) , 
RLIMIT NPTS (FreeBSD 8.0) , 
RLIMIT RSS (FreeBSD 8.0. Linux 3.2.0. 
Mac OS X 10.6.8) , 
RLIMIT SBSIZE (FreeBSD 8.0) , 
RLIMIT SIGPENDING (Linux 3.2.0) , 
RLIMIT, SWAP (FreeBSD 8.0) , 
RLIMIT_VMEM (Solaris 10) 
返回 值 : BRD, EO: 若 出 错 ， 返 回 -1 


*gets(char *buf); 
«stdio.h» 


RE: FRH, BE buf; SORIA, IE] NULL 


*getservbyname (const char *name, const char *proto); 
«netdb.h» 
返回 值 : 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 


*getservbyport(int port, const char *proto); 
«netdb.h» 
返回 值 : FRH, EEEH: FBR, BE NULL 


*getservent (void) ; 
<netdb.h> 
返回 值 ， 若 成 功 ， 返 回 指针 ， 若 出 错 ， 返 回 NULL 


getsid(pid t pid); 
«unistd.h» 


返回 值 ， 关 成功， 返回 会 话 首 进程 的 进程 组 ID; 若 出 错 ， 返 回 -1 


getsockname {int sockfd, struct sockaddr *restrict addr, 
SoCklen t *restrict alenp); 
<sys/socket.h> 


返回 值 ， 关 成功， 返回 0; AHE, ge- 


getsockopt(int sockd, int level, int option, void *restrict val, 
socklen t *restrict lenp}: 
<sys/socket.h> 


返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 --] 


*getspent (void); 
<shadow.h> 
返回 值 ， 若 成 功 ， 返 回 指针 ;， 若 出 错 ， 返 回 NULL 
平台 ，Linux 3.2.0. Solaris 10 


*getspnam(const char *name); 
<shadow.h> 
返回 值 ， 若 成 功 ， 返 回 指针 ;， 若 出 错 ， 返 回 NULL 
FA: Linux 3.2.0、Solaris 10 


gettimeofday (struct timeval *restrict fp, 
void *restrict fzp); 





p. 152 


p. 599 
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<sys/time.h> 


返回 值 ， 总 是 返回 0 


getuid (void); 
<unistd.h> 


返回 值 : WANA ID 


*gmtime(const time t *calptr); 
<time.h> 


返回 值 ， 指 向 分 解 的 tm 结构 的 指针 ， 若 出 错 ， 返 回 NULL 


grantpt (int fd); 
<stdlib.h> 
返回 值 : 若 成功 ， 返 回 0; 若 出 错 ， 返 回 -1 


htonl(uint32 t hostint32); 
<arpa/inet.h> 


返回 值 ， 以 网 络 字 节 序 表示 的 32 位 整数 


htens(uintl6 t hostintló); 
<arpa/inet.h> 


返回 值 ， 以 网 络 字 节 序 表示 的 16 位 整数 


*inet ntop(int domain, const void *restrict addr, 
char *restrict str, socklen t size); 
<arpa/inet.h> 


BREE: AR. SS ast, Fh, E NULL 


inet pton(int domain, const char *restrict str, 
void *restrict addr); 
«arpa/inet.h» 


返回 值 ， 着 成 功 ， 返 回 1: 者 格式 无 效 ， 返 回 0; 着 出 错 ， 返 回 -1 


initgroups {const char *username, gid t basegid); 
<grp.h> /* Linux & Solaris */ 
<unistd.h> /* FreeBSD & Mac OS X */ 
BEE: FRH. BE o FHR, RE- 


ioctl (int fd, int request, ...); 
<unistd.h> /* System V */ 
«sys/ioctl.h» /* BSD and Linux */ 


返回 值 ， 若 出 错 ， 返 回 ~1， 若 成 功 ， 返 回 其 他 值 


isatty(int fd); 
«unistd.h» 


返回 值 ， 若 为 终端 设备 ， 返 回 (A); 否则 ， 返 回 0 ( 假 ) 


kill (pid t pid, int signo); 
<signal.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


lchown(const char *path, uid t owner, gid t group); 
«unistd.h» . 


返回 值 : XB. 返回 0: dus. 返回 -1 


link(const char *existingpath, const char *newpath); 
«unistd.h» 


BFE: AMD. JRO; FBE, gE- 


linkat(int efd, const char *existingpath, int nfd, 
const char *newpath, int flag); 
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<unistd.h> 
flag: AT_SYMLINK_NOFOLLOW 
返回 值 : 若 成 功 ， 返 回 0; Hh, ap- 


lio listio(int mode, struct aiocb *restrict const list[restrict], 
int nent, struct sigevent *restrict sigev); 
«aio.h» 
mode: LIO NOWAIT. LIO WAIT 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


listen(int sockfd, int backlog); 
<sys/socket.h> 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


*localtime(const time t *calprr); 
<time.h> 


返回 值 ， 指 向 分 解 的 tm 结构 的 指针 ， 若 出 错 ， 返 回 NULL 


longjmp (jmp_buf env, int val); 
<setjmp.h> 


这 个 函数 不 返回 


lseek(int fd, off t offset, int whence); 
«unistd.h» 
whence: SEEK SET. SEER CUR. SEEK END 
返回 值 : 车 成 功 ， 返 回 新 的 文件 偏 移 量 ; 若 出 错 ， 返 回 -1 


lstat(const char *restrict path, struct stat *restrict buf); 
«sys/stat.h» 
返回 值 ， 若 成 功 ， 返 回 EHW. gE- 


*malloc(size t size); 
«stdlib.h» 
返回 值 ， 若 成 功 ， 返 回 非 空 指针 ， 若 出 错 ， 返 回 NULL 


mkdir(const char *path, mode t mode); 
<sys/stat.h> 
mode: S_IS[UG] ID, S_ISVTX, 
S_I[RWX] (USR|GRP| OTH) 
返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 --1 


mkdirat (int fd, const char *path, mode t mode); 
«sys/stat.h» 
mode: S 1S[UG]ID. S ISVTX. 
S_I [RWX] (USR| GRP| OTH) 
BREE: FRH, elo; Fi, BE- 


*mkdtemp (char *template); 
<stdlib.h> 
返回 值 ， 若 成 功 ， 返 回 指向 目录 名 的 指针 ; FW, AE NULL 


mkfifo(const char *path, mode t mode): 
«sys/stat.h» 
mode: S IS[UG]ID. S ISVTX. 
S I[RWX] (USR| GRP|IOTH) 
返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


mkfifoat(int fd, const char *path, mode t mode); 
«sys/stat.h» 
mode: S 1S[UG]ID. S ISVTX. 
S I[RWX]) (USR| GRP| OTH) 
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返回 值 : 若 成 功 ， 返 回 o. 若 出 错 ， 返 回 -1 


mkstemp(char */empíate) ; 
<stdlib.h> p. 169 
返回 值 : AR, BER: 若 出 错 ， 返 回 -1 


mktime(struct tm *fmpfr) ; 
<time.h> p. 192 
IRMA: 车 成 功 ， 返 回 晶 历时 间 ， 车 出 错 ， 返 回 -~] 


*mmap(void *addr, size t len, int prot, int flag, int fa, 
off t off; 
<sys/mman.h> p. 525 
prot: PROT_READ. PROT WRITE. PROT EXEC. PROT NONE 
flag: MAP FIXED. MAP SHARED. MAP PRIVATE 
返回 值 : 若 成 功 ， 返 回 映射 区 的 起 始 地 址 ; 车 出 错 ， 返 回 MAP FAILED 


mprotect(void *addr, size t len, int prot); 
<sys/mman.h> p. 527 
返回 值 : Ry. REO; 车 出 错 ， 返 回 -1 

msgctl (int msgid, int cmd, struct msgid ds *buf); 
«sys/msg.h» p. 562 
cmd: IPC STAT. IPC SET. IPC RMID 
返回 值 : 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


msgget(key t key, int flag); 
<sys/msg.h> p. 562 
flag: IPC CREAT. IPC_EXCL 
返回 值 ， 若 成 功 ， 返 回 消息 队列 ID， 若 出 错 ， 返 回 -1 


msgrcv(int msgid, void *pir, size t nbytes, long type, int flag); 
«sys/msg.h» p. 564 
flag: IPC NOWAIT. MSG NOERROR 
返回 值 : 若 成 功 ， 返 回 消息 数据 部 分 的 长 度 ， 著 出 错 ， 返 加 -1 


msgsnd(int msgid, const void *ptr, size t nbytes, int flag); 
<sys/msg.h> p. 563 
flag: IPC NOWAIT 
返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


msync(void *addr, size t len, int flags); 
<sys/mman.h> p. 528 
flag: MS ASYNC. MS INVALIDATE. MS SYNC 
返回 值 : 若 成 功 ， 返 回 0; H. gE- 


munmap (void *addr, size t len); 
<sys/mman.h> p. 528 
返回 值 ， 若 成 功 ， 返 回 0; AW, 3R[BI-]l 


nanosleep(const struct timespec *regip, 
struct timespec *remlip); 
<time.h> p. 374 
返回 值 ， 若 休眠 够 要 求 的 时 间 ， 返 回 0; 若 出 错 ， 返 回 -1 


nice(int incr); 
<unistd.h> p. 276 
返回 值 : 若 成 功 ， 返 回 新 的 nice 值 减 掉 NzERO; 若 出错 ， 返 回 -1 


ntohl(uint32 t nmetint32); 
«arpa/inet.h» p. 594 
返回 值 : 以 主机 字 节 序 表 示 的 32 位 整数 
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uintl6 t 


int 


DIR 


void 


FILE 


FILE 


long 


ntohs(uintló t netintló); 
«arpa/inet.h» 


MEA: 以 主机 字 节 序 表示 的 16 位 整数 


open (const char *path, int oflag, ... /* mode t mode */ ); 

«fcntl.h» 
oflag: O. RDONLY. O WRONLY. O_RDWR, O EXEC, 

O, SEARCH; 

O APPEND. O CLOEXEC. O CREAT. 

O,. DIRECTORY. O DSYNC. O EXCL. 

O NOCTTY. O NOFOLLOW. O NONBLOCK. 

O RSYNC. O SYNC. O TRUNC. O TTY INIT 
mode: S IS[UG]ID. S ISVTX. 

S_I [RWX] (USR |GREP | OTH) 
返回 值 : 若 成 功 ， 返 回 文件 描述 符 ; 若 出 错 ， 返 回 -1 
平台 : 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 还 有 一 个 O_FSYNC 标志 


openat(int fd, const char *path, int oflag, ... 
/* mode t mode */ ); 
«fcntl.h» 
oflag: O RDONLY. O WRONLY. O_RDWR. O EXEC, 
O, SEARCH; 
O, APPEND. O_CLOEXEC. O CREAT. 
O DIRECTORY. O DSYNC. O EXCl. 
O, NOCTTY. O NOFOLLOW. O NONBLOCK. 
O RSYNC. O SYNC. O TRUNC. O TTY INIT 
mode: S IS[UG]ID. S ISVTX. 
S I[RWX] (USR|GRP | OTH) 
EMA: 车 成 功 ， 返 回 文件 描述 符 : 车 出 错 ， 返 回 -1 
平台 ; 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 还 有 一 个 0_FSYNC 标志 


*opendir(const char *path); 
«dirent.h» 


返回 值 : FRH, BERE: 若 出 错 ， 返 回 NULL 


openlog(const char *ident, int option, int facility); 

<syslog.h> 

option: LOG, CONS. LOG NDELAY. LOG NOWAIT. 
LOG, ODELAY. LOG PERROR. LOG, PID 

facility; LOG AUTH. LOG AUTHPRIV. LOG CRON,. 
LOG DAEMON. LOG FTP. LOG KERN. 
LOG LOCAL[0-7]. LOG LPR. LOG MAIL. 
LOG NEWS. LOG SYSLOG. LOG USER. LOG UUCP 


*open menstream(char **bufp, size t *sizep); 
«stdio.h» 


返回 值 : 车 成 功 ， 返 回流 指针 ， 落 出 错 ， 返 回 NULL 


*open wmemstream(wchar t **bufp, size t *sizep); 
<wchar.h> 


返回 值 : 车 成 功 ， 返 回流 指针 ; AMS. RE NULL 


pathconf (const char *path, int name); 
<unistd.h> 
name: PC ASYNC IO. PC CHOWN RESTRICTED. 
PC FILESIZEBITS. PC, LINK MAX. 
.PC MAX CANON. PC MAX INPUT. 
.PC NAME MAX. PC NO TRUNC. PC PATH MAX. 
—PC PIPE BUF. PC PRIO IO. PC SYMLINK MAX. 
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.PC SYNC IO. .PC TIMESTAMP RESOLUTION, 
.PC,2 SYMLINKS. _PC_VDISABLE 


pause (void); 
«unistd.h» p. 338 
返回 值 : -1, errno 设置 为 EINTR 


pclose(FILE *fp): 
<stdio.h> p. 541 
返回 值 ， 若 成 功 ， 返 回 popen 函数 中 emdsrring 的 终止 状态 ， 车 出 错 ， 返 回 -1 


perror(const char *msg); 
«stdio.h» p.15 


pipe(int fd[2]); 
<unistd.h> p. 535 
返回 值 ， 若 成 功 ， 返 回 0; E, RE- 


poll(struct pollfd /darray(], nfds t nfds, int fimeout); 
<poll,h> p. 506 
IRMA: AES RRR, ARN. oRIBLO: 若 出 错 ， 返 回 -1 


*popen(const char *cmdstring, const char *type); 
<stdio.h> p. 541 
type: Sr nw" 
返回 值 : 若 成 功 ， 返 回 文件 指针 : 若 出 错 ， 返 回 NULL 


posix openpt(int oflag); 
«stdlib.h» p. 722 
«fcntl.h» 
oflag: O RWDR. O NOCTTY 
返回 值 : 车 成 功 ， 返 回 下 一 个 可 用 的 PTY 主 设 备 文件 描述 符 ; 若 出 错 ， 返 回 -1 


pread(int fd, void *buf, size t nbytes, off t offset); 
«unistd.h» p. 78 


返回 值 : 读 到 的 字 节 数 ， 若 已 到 达 文 件 尾 端 ， 返 回 0 若 出 错 ， 返 回 -1 


printf (const char *restrict format, ...); 
<stdio.h> p. 159 
返回 值 : 着 成 功 ， 返 回 输出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


pselect(int maxfdpl, fd set *restrict readfds, 
fd set *restrict writefds, £d set *restrict excepffds, 
const struct timespec *restrict (sptr, 
const sigset t *restrict sigmask) ; 
<sys/select.h> p. 506 
返回 值 ， TERME EORTHEG BRN, EO: BU, ge- 


psiginfo(const siginfo t *info, const char *msg); 
«signal.h» p. 379 


psignal(int signo, const char *msg); 
' <signal.h> p. 379 
<siginfo.h> /* on Solaris */ 


pthread_atfork(void (*prepare) (void), void (*parent) (void), 
void (*child) (void)); 
<pthread.h> p. 458 
返回 值 ， 若 成 功 ， 返 回 0;， 否则 ， 返 回 错误 编号 


pthread attr destroy (pthread attr t *altr}; 
<pthread.h> p. 427 
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int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


BE: FRH, BEO 否则 ， 返 回 错误 编号 


pthread attr getdetachstate (const pthread attr t *attr, 
int *detachstate) ; 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错 误 编号 


pthread attr getguardsize(const pthread attr t 
*restrict attr, 
size t *restrict guardsize); 
«pthread.h» 
REHA: 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread attr getstack(const pthread attr t *restrict attr, 
void **restrict sfackaddr, 
size t *restrict stacksize) ; 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 
pthread attr getstacksize(const pthread attr t 
*restrict attr, 
size t *restrict stacksize); 
<pthread.h> 
返回 值 ; 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread attr init(pthread attr t *atfr); 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 和 否则， 返回 错误 编号 


pthread attr setdetachstate(pthread attr t *attr, 
int detachstate) ; 
<pthread.h> 
detachstate: PTHREAD CREATE DETACHED. 
PTHREAD CREATE JOINABLE 
返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错 误 编 号 


pthread attr soetguardsize(pthread attr t *attr, 
size t guardsize) ; 
«pthread.h» 


返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 问 错误 编号 


pthread attr setstack(const pthread attr t *attr, 
void *stackaddr, size t *stacksize); 
«pthread.h» 
返回 值 : Be, lO; GU, BARS 


pthread attr setstacksirze(pthread attr t “attr, 
size t stacksize) ; 
«pthread.h» 
返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错 误 编 号 


pthread barrierattr destroy (pthread barrierattr t *atfr); 
<pthread.h> 
返回 值 : Hk). Bo; FW. APARRA S 


pthread barrierattr getpshared(const pthread barrierattr t 
*restrict attr, 
int *restrict pshared); 
«pthread.h» 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread barrierattr init(pthread barrierattr t *attr); 
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<pthread.h> p. 441 
返回 值 : FRU. lO; 否则 ， 返 回 错误 编号 


pthread barrierattr setpshared(pthread barrierattr t ‘aftr, 
int pshared) ; 
<pthread.h> p. 441 
pshared: PTHREAD PROCESS PRIVATE. 
PTHREAD PROCESS SHARED 
返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


pthread barrier destroy (pthread barrier t *barrier); 
<pthread.h> p. 418 
返回 值 ， 若 成 功 ， 返 回 0;， 否则， 返回 错误 编号 


pthread barrier init(pthread barrier t *restrict barrier, 
constpthread barrierattr t 
*restrict attr, 
unsigned int count); 


<pthread.h> p. 418 
返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 869 
pthread barrier wait(pthread barrier t *barrier); 
<pthread.h> p. 419 
返回 值 : 若 成 功 ， 返 回 0 或 者 PTHREAD BARRIER, SERIAL THREAD; 
否则 ， 返 回 错误 编号 
pthread cancel(pthread t tid); 
<pthread.h> p. 393 


返回 值 : Sk. BAO: FU. BERS 


pthread cleanup pop(int execute); 
<pthread.h> p. 394 


pthread cleanup push(void (*rin) (void *), void *arg); 
<pthread.h> p. 394 


pthread_condattr_destroy (pthread_condattr_t *attr); 
<pthread.h> p. 440 
返回 值 ， 若 成 功 ， 返 回 0;， 和 否则， 返回 错误 编号 


pthread condattr getclock(const pthread condattr t 
*restrict atir, 
clockid t *restrict clock id); 
<pthread.h> p. 441 
返回 值 : 若 成 功 ， 返 回 0;， 杏 则 ， 返 回 错误 编号 


pthread condattr geatpsharedl(const pthread condattr t 
*restrict attr, 
int *restrict pshared); 
<pthread.h> p. 440 
返回 值 : 车 成 功 ， 返 回 4， 和 否则， 返回 错误 编号 


pthread condattr init(pthread condattr t *attr); 
«pthread.h» p. 440 
返回 值 ， 若 成 功 ， 返 回 0;， 和 否则， 返回 错误 编号 


pthread condattr setclock(pthread condattr t *anr, 
clockid t clock id); 
«pthread.h» p. 441 
A: SR. elo: 否则， 返回 错误 编号 


pthread condattr setpshared(pthread condattr t *atir, 


704 BRA ”函数 原型 


int 


int 


int 


int 


int 


int 


int 


int 


int 


void 
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int pshared) ; 
<pthread.h> 
pshared: PTHREAD PROCESS, PRIVATE. 
PTHREAD PROCESS SHARED 


pthread cond broadcast(pthread cond t *cond); 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错 误 编号 


pthread cond destroy (pthread cond t *cond); 
<pthread.h> 
BE: FRW., Bo: 否则 ， 返 回 错误 编号 


pthread cond init(pthread cond t *restrict cond, 
const pthread condattr t *restrict afir); 
<pthread.h> 
BAA: 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread cond signal(pthread cond t *cond): 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0 否则， 返回 错误 编号 


pthread cond timedwait(pthread cond t *restrict cond, 
pthread mutex t *restrict mutex, 
const struct timespec 
*restrict timeout); 
«pthread.h» 


返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


pthread cond wait(pthread cond t *restrict cond, 
pthread, mutex t *restrict mutex); 
<pthread.h> 


返回 值 : SR, BESO: FU, BRAS 


pthread_create (pthread t *restrict tidp, 
const pthread attr t *restrict attr, 
void *(*start rtn) (void *), 
void *restrict arg); 
«pthread.h» 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread detach(pthread t tid); 
«pthread.h» 
返回 值 ， 车 成 功 ， 返 回 0;， 和 否则， 返回 错误 编号 


pthread equal(pthread t tidi, pthread t fid2); 
<pthread.h> 
IRMA: 若 相等 ， 返 回 非 0 数值 否则， 返回 0 


pthread exit(void *rval ptr); 
«pthread.h» 


*pthread getspecific(pthread key t key); 
<pthread.h> 
返回 值 ， 线 程 特定 数据 值 ， 若 没有 值 与 该 键 关联 ， 返 回 NULL 


pthread join(pthread t thread, void **rval ptr); 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


pthread key_create (Pthread_key_t *keyp, 
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p. 389 


p. 449 
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void (*destructor) (void *)): 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread key delete(pthread key t key); 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


pthread kill(pthread t thread, int signo); 
<signal.h> 


EMA: 4k, EE 0 否则 ， 返 回 错误 编号 
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p. 447 


p. 448 


p. 455 


pthread mutexattr destroy (pthread mutexattr t *atir); 


<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错 误 编 号 


p. 431 


pthread mutexattr getpshared(const pthread mutexattr t 


*restrict attr, 


int *restrict pshared); 


«pthread.h» 
返回 值 ， 车 成 功 ， 返 回 0， 否 则 ， 返 回 错 误 编号 


p. 431 


pthread mutexattr getrobust (const pthread mutexattr t 


*restrict attr, 
int *restrict robust); 
<pthread.h> 
返回 值 ， 车 成 功 ， 返 回 0。 否则 ，、 返 回 错误 编号 


p. 432 


pthread mutexattr gettype(const pthread mutexattr t 


*restrict attr, 

int *restrict type); 
«pthread.h» 
EE: BRD, REO: 否则 ， 返 回 错误 编号 


pthread mutexattr init(pthread mutexattr t *atir); 
«pthread.h» 
返回 值 : FRH. aeo 否则 ， 返 回 错误 编号 


p. 434 


p.431 


pthread mutexattr setpshared(pthread mutexattr t *attr, 


int pshared) ; 
<pthread.h> 
pshared: PTHREAD PROCESS PRIVATE. 
PTHREAD PROCESS SHARED 
返回 值 : 若 成 功 ， 返 回 FU, RERA S 


p. 431 


pthread mutexattr setrobust(pthread mutexattr t *arr, 


int robust); 
<pthread.h> 
robust: PTHREAD MUTEX ROBUST. 
PTHREAD MUTEX STALLED 
JRF: FED, lO; BM. BERAS 


p. 432 


pthread mutexattr settype(pthread mutexattr t *afir, int type); 


<pthread.h> 

type: PTHREAD MUTEX NORMAL, 
PTHREAD MUTEX ERRORCHECK, 
PTHREAD MUTEX RECURSIVE. 
PTHREAD MUTEX DEFAULT 

返回 值 若 成 功 ， 返回 0: EM, 返回 错误 编号 


pthread mutex consistent(pthread mutex t *mutex) ; 
<pthread.h> 


p. 434 


p. 433 
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int 
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返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


pthread mutex destroy (pthread mutex 七 *mutex); 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread mutex init(pthread mutex t *restrict mutex, 
const pthread mutexattr t *restrict attr); 
<pthread.h> 
返回 值 ， 车 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


pthread_mutex_lock (pthread mutex t *mutex) ; 
<pthread.h> 
返回 值 : Sk, BAO; 和 否则， 返回 错误 编号 


pthread mutex timedlock(pthread mutex t *restrict mutex, 
const struct timespec *restrict ftsptr); 
<pthread.h> 
«time.h» 


BEA: 若 成 功 则 ， 返 回 0， 和 否则， 返回 错误 编号 


pthread mutex trylock(pthread mutex t *mutex); 
«pthread.h» 
返回 值 : 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


pthread mutex unlock (pthread mutex t *mutex); 
<pthread.h> 
返回 值 : 若 成 功 ， 返 回 0; 和 否则 ， 返 回 错误 编号 


pthread once(pthread once t *initflag, void (*initffn) (void)); 
<pthread.h> 
pthread_once_t initflap- PTHREAD ONCE INIT; 
返回 值 : 若 成 功 ， 返 回 0 否则， 返回 错误 编号 


pthread rwlockattr destroy pthread rwlockattr t *attr); 
«pthread.h» 


返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


pthread rwlockattr getpshared(const pthread rwlockattr t 
*restrict attr, 
int *restrict pshared); 
<pthread.h> 
EA: 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


pthread rwlockattr init(pthread rwlockattr t *attr); 
«pthread.h» 
BE: 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


pthread rwlockattr setpshared(pthread rwlockattr t *attr, 
int pshared); 
<pthread.h> 
pshared: PTHREAD PROCESS PRIVATE. 
PTHREAD PROCESS, SHARED 
返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


pthread rwlock destroy (pthread rwlock t *rwlock); 
<pthread.h> 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错 误 编号 


pthread rwlock init(pthread rwlock t *restrict rwlock, 
const pthread rwlockattr t 
*restrict attr); 
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p. 440 
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<pthread.h> p. 409 
返回 值 : 车 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


int pthread_rwlock_rdlock (pthread_rwlock_t *rwlock) ; 
<pthread.h> p. 410 
返回 值 : 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 


int pthread rwlock timedrdlock(pthread rwlock t *restrict rwlock, 
const struct timespec 
*restrict tspir); 
<pthread.h> p. 413 
«time.h» 


返回 值 : FRH. leo: AM, BRAS 


int pthread rwlock timedwrlock(pthread rwlock t *restrict rwlock, 
const struct timespec 
*restrict fsptr); 


<pthread.h> p. 413 
<time.h> 
返回 值 ， 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 

int pthread_rwlock_tryrdlock (pthread rwlock t *rwlock); 
«pthread.h» p. 410 
返回 值 : 车 成 功 ， 返 回 0; FU, RGR 

int pthread rwlock trywrlock(pthread rwlock t *rwlock); 
<pthread.h> p. 410 
返回 值 : 若 成 功 ， 返 回 0， 否 则 ， 返 回 错 误 编 号 

int pthread rwlock unlock (pthread rwlock t *rwlock); 
<pthread.h> p. 410 
返回 值 : 若 成 功 ， 返 回 0; Fl, BRAS 

int pthread rwlock wrlock(pthread rwlock t *rwlock); 
«pthread.h» p.410 


返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 
pthread t pthread self (void); 


<pthread.h> p. 385 
返回 值 ， 调 用 线程 的 线程 ID 
int pthread setcancelstate(int state, int *oldstate); 
<pthread.h> p. 451 


State: PTHREAD CANCEL, ENABLE, 
PTHREAD CANCEL DISABLE 
PMA: 若 成 功 ， 返 回 0， 和 否则 ， 返 回 错误 编号 


int pthread setcanceltype (int type, int *oldtype); 
<pthread.h> p. 453 
iype: PTHREAD CANCEL, DEFERRED. 
PTHREAD CANCEL ASYNCHRONOUS 


返回 值 ， 若 成 功 ， 返 回 0;， 否 则 ， 返 回 错 误 编 号 875 
int pthread setspecific(pthread key t key, const void *value); 
<pthread.h> p. 449 
返回 值 : 若 成 功 ， 返 回 0;， 和 否则 ， 返 回 错误 编号 
int pthread sigmask(int how, const sigset t *restrict set, 
sigset t *restrict oset); 
«signal.h» p. 454 


how: SIG BLOCK. SIG UNBLOCK. SIG SETMASK 
返回 值 ， 若 成 功 ， 返 回 0; 否则 ， 返 回 错误 编号 
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int pthread spin, destroy (pthread spinlock t *lock); 


int pthread spin init(pthread spinlock t */ock, int pshared); 


<pthread.h> 


<pthread.h> 

pshared: PTHREAD_PROCESS_PRIVATE, 
PTHREAD PROCESS, SHARED 

返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


int pthread spin lock(pthread spinlock t *lock); 


<pthread.h> 


int pthread spin trylock(pthread spinlock t *lock); 


<pthread.h> 
返回 值 : 车 成 功 ， 返 回 0， 否 则 ， 返 回 错误 编号 


int pthread spin unlock (pthread spinlock t *lock): 


«pthread.h» 
返回 值 ， 若 成 功 ， 返 回 0， 否 则 ， 返 回 错 误 编号 


void pthread testcancel(void); 


<pthread.h> 


char *ptsname (int fd); 


<stdlib.h> 
BE: 若 成 功 ， 返 回 指向 PTY 从 设备 名 的 指针 ， 


int putc(int c, FILE *fp); 


<stdio.h> 


返回 值 ， 车 成 功 ， 返 回 ce， 车 出 错 ， 返 回 cor 


int putchar(int c); 


«stdio.h» 


BEW: FRH. RE c; 落 出 错 ， 返 回 EOF 


int putchar unlocked(int c); 


«stdio.h» 


返回 值 ; 若 成 功 ， 返回 cy 车 出 错 ， 返回 EOF 


int putc unlocked(int c, FILE *fp); 


«stdio.h» 


REHE: FRH. BE c FHE, BE EOF 


int putenv(char *sir); 

<stdlib.h> 

返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 非 0 
int puts (const char *sir); 

<stdio.h> 


ssize t pwrite(int fd, const void *buf, size t nbytes, off t offset); 


返回 值 ; 车 成 功 ， 返回 非 负 值 ; FH, 返回 EOF 


<unistd.h> 


返回 值 ， 若 成 功 ， 返 回 已 写 的 字 节 数 ， 若 出 错 ， 返 回 -1 


int raise(int signo); 


<signal.h> 


返回 值 ， 若 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 


ssize t read(int fd, void *buf, size t nbytes); 


<unistd.h> 


车 出 错 ， 返 回 NULL 





p. 417 
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p.418 
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p. 723 
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p. 337 
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struct 


dirent 


ssize t 


ssize t 


ssize t 


void 


ssize t 


ssize t 


ssize t 
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MAME: RAMSAR: SCADA, EO: 若 出 错 ， 返 回 -1 


*readdir(DIR *dp); 
«dirent.h» p. 130 
ME: 若 成 功 ， 返 回 指针 : 若 在 目录 尾 或 出 错 ， 返 回 NULL 


readlink(const char *restrict path, char *restrict buf, 
size t bufsize); 
<unistd.h> p. 123 
返回 值 ， 若 成 功 ， 返 回 读 取 的 字 节 数 ， 若 出 错 ， 返 回 -1 


readlinkat(int fd, const char* restrict path, 
char *restrict buf, size t bufsize); 
«unistd.h» p. 123 
返回 值 ， 若 成 功 ， 返 回 读 取 的 字 节 数 ， 若 出 错 ， 返 回 -1 


readv(int fd, const struct iovec *iov, int iovcnt); 
<sys/uio.h> p. 521 
返回 值 : 郑成功， 返回 已 读 的 字 节 数 ， 若 出 错 ， 返 回 -1 


*realloc(void *pír, size t newsize); 
<stdlib.h> p. 207 
返回 值 ; Xm, 返回 非 空 指针 ; 车 出 错 ， 返回 NULL 


recv(int sockfd, void *buf, size t nbytes, int flags); 

«sys/socket.h» p. 612 
flags: MSG PEEK, MSG OOB, MSG WAITALL, 

MSG CMSG CLOEXEC (Linux 3.2.0) , 

MSG DONTWAIT (FreeBSD 8.0. Linux 3.2.0. 

Solaris 10) , 

MSG ERRQUEUE (Linux 3.2.0) , 

MSG TRUNC (Linux 3.2.0) 
返回 值 ， 数 据 的 字 节 长 度 ， 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 

车 出 错 ， 返 回 -1 


recvfrom(int sochd, void *restrict buf, size t len, int flags, 
struct sockaddr *restrict addr, 
Socklen t *restrict addrlen); 
<sys/socket.h> p. 613 
flags: MSG_PEEK, MSG_OOB, MSG_WAITALL, 
MSG_CMSG_CLOEXEC (Linux 3.2.0) , 
MSG DONTWAIT (FreeBSD 8.0. Linux 3.2.0, 
Solaris 10) , 
MSG ERRQUEUE (Linux 3.2.0) , 
MSG TRUNC (Linux 3.2.0) 
BE: 数据 的 字 节 长 度 ; 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 
若 出 错 ， 返 回 ~1 


recvmsg (int sockd, struct msghdr *msg, int flags); 
<sys/socket.h> p. 613 
flags: MSG_PEEK, MSG_OOB, MSG_WAITALL, 
MSG_CMSG_CLOEXEC (Linux 3.2.0) , 
MSG_DONTWAIT (FreeBSD 8.0. Linux 3.2.0. 
Solaris 10) , 
MSG ERRQUEUE (Linux 3.2.0) , 
MSG, TRUNC (Linux 3.2.0) 
返回 值 ， 数 据 的 字 节 长 度 ; 若 无 可 用 数据 或 对 等 方 已 经 按 序 结束 ， 返 回 0; 
若 出 错 ， 返 回 -1 
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int 


int 


int 


void 


void 


int 


int 


void 


int 


int 


int 


int 


int 


int 


int 


remove(const char *path); 
<stdio.h> p. 119 
RPE: FRH. WEO FH, gE- 


rename {const char *oldname, const char *newname); 
<stdio.h> p. 119 
返回 值 ， 若 成 功 ， 返 回 0; EH, ge- 


renameat(int oldfd, const char *oldname, int newfd, 
const char *newname) ; 
<stdio.h> p. 119 
返回 值 : 车 成 功 ， 返回 0; Xung 返回 -1 


rewind(FILE *fp); 


<stdio.h> p. 158 
rewinddir (DIR *dp); 

«dirent.h» p. 130 
rmdir(const char *path); 

<unistd.h> p. 130 

返回 值 : 车 成 功 ， 返回 0; Tus. 返回 -1 
scanf (const eher *restrict format, ...); 

«stdio.h» p.162 


返回 值 ， 赋 值 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 转换 前 已 到 达 文 件 尾 端 ， 返 回 EOF 


seekdir(DIR *dp, long loc); 
«dirent.h» p. 130 


select (int maxfdpl, fd set *restrict readfds, 
fd set *restrict writefds, fd set *restrict exceptfds, 
struct timeval *restrict tvptr); 
<sys/select.h> p. 502 
返回 值 ， VERONAE DATE; BH, WO; 若 出 错 ， 返 回 -1 


sem close(sem t *sem); 
<semaphore.h> p. 580 
返回 值 ， 若 成 功 ， 返 回 0; 苦 出 错 ， 返 回 -1 


semctl (int semid, int semnum, int cmd, ... 
/* union semun arg */ ): 
<sys/sem.h> p. 567 
cmd: IPC STAT. IPC SET, IPC_RMID, GETPID. 
GETNCNT. GETZCNT. GETVAL. SETVAL. 
GETALL. SETALL 
返回 值 : 〈 返 回 值 取决 于 命令 ) ; AH, RE- 


sem destroy(sem t *sem); 
<semaphore.h> p. 582 


返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


semget(key t key, int nsems, int flag): 
<sys/sem.h> p. 567 
flag: IPC_CREAT. IPC EXCL 
返回 值 ， 若 成 功 ， 返 回信 号 量 ID， 若 出 错 ， 返 回 -1 


sem getvalue(sem t *restrict sem, int *restrict valp); 
<semaphore.h> p. 582 


返回 值 ， 若 成 功 ， 返回 0; Fie, 返回 -1 


sem init(sem t *sem, int pshared, unsigned int value); 
<semaphore.h> p. 582 
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返回 值 : 车 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


int semop(int semid, struct sembuf semoparray[], size t mops); 
<sys/sem.h> p. 568 
返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 
sem t *sem open(const char “name, int oflag, ... /* mode t mode, 
unsigned int value */ }; 
<semaphore.h> p. 579 


flag: IPC CREAT. IPC EXCL 
返回 值 ， 若 成 功 ， 返 回 指向 信号 量 的 指针 ; AHS, IRIE] SEM FAILED 


int som post(sem t *sem); 
<semaphore.h> p. 582 


返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


int sem timedwait(sem t *restrict sem, 
const struct timespec *restrict fsptr); 
<semaphore.h> p. 581 
<time.h> 


返回 值 : A HEIN. 返回 0; Sue, 返回 ~i 


int sem trywait(sem t *sem); 
«semaphore.h» p. 581 


RE: ERD, Reo EH, gE- 


int sem _ unlink (const char *name); 
<semaphore.h> p. 580 
返回 值 : TEE. 返回 0; 车 出 错 ， 返 问 ~1 


int sem wait(sem t *sem); 
<semaphore.h> p. 581 


返回 值 ， 若 成 功 ， 返 回 0: 若 出 错 ， 返 回 -1 


ssize t send(int sockfd, const void *buf, size t nbytes, int flags); 
«sys/socket.h» p. 610 
flags: MSG_EOR, MSG OOB, MSG NOSIGNAL, 
MSG CONFIRM (Linux 3.2.0) , 
MSG, DONTROUTE (FreeBSD 8.0. Linux 3.2.0. 
Mac OS X 10.6.8. Solaris 10) , 
MSG DONTWAIT (FreeBSD 8.0. Linux 3.2.0. 
Mac OS X 10.6.8. Solaris 10) , 
MSG EOF (FreeBSD 8.0. Mac OS X 10.6.8) , 
MSG MORE (Linux 3.2.0) 
返回 值 : 若 成 功 ， 返 回 发 送 的 字 节 数 ， 若 出 错 ， 返 回 -~1 


ssize t sendmag(int sockfd, const struct msghdr *msg, int flags); 
<sys/socket.h> p. 611 
flags: MSG_EO, MSG_OOB, MSG_NOSIGNAL, 
MSG_CONFIRM (Linux 3.2.0) , 
MSG_DONTROUTE (FreeBSD 8.0. Linux 3.2.0, Mac OS X 10.6.8. 
Solaris 10) , 
MSG_DONTWAIT (FreeBSD 8.0. Linux 3.2.0. Mac OS X 10.6.8. 
Solaris 10) , 
MSG_EOF (FreeBSD 8.0. Mac OS X 10.6.8) , 
MSG_MORE (Linux 3.2.0) 
返回 值 : 若 成 功 ， 返 回 发 送 字 节 数 ， 若 出 错 ， 返 回 ~1 


ssize t sendto(int sockfd, const void *buf, size t nbytes, int flags, 
const struct sockaddr *destaddr, socklen, t destlen) ; 
<sys/socket.h> p. 610 


882 
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flags: MSG EOR, MSG OOB, MSG NOSIGNAL, 
MSG CONFIRM (Linux3.2.0) , 
MSG_DONTROUTE (FreeBSD 8.0. Linux 3.2.0, Mac OS X 10.6.8. Solaris 10), 
MSG  DONTWAIT(FreeBSD 8.0. Linux 3.2.0. Mac OS X 10.6.8. Solaris 10), 
MSG EOF (FreeBSD 8.0, Mac OS X 10.6.8) , 
MSG MORE (Linux 3.2.0) 

返回 值 ， 若 成 功 ， 返 回 发 送 的 字 节 数 ， 若 出 错 ， 返 回 -1 


void Setbu (FILE *restrict fp, char *restrict buf); 


<stdio.h> p. 146 


int setegid(gid_t gid); 


<unistd.h> p. 258 
返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


int setenv {const char *name, const char *value, int rewrite); 


<stdlib.h> p. 212 
ik[pME: ERD, REO APA, X[Bl-1 


int seteuid(uid t uid); 


«unistd.h» p. 258 
返回 值 : FRH, BE o: Ht Be- 


int setgid(gid t gid); 


«unistd.h» p. 256 
返回 值 ， 若 成 功 ， 返 回 FHR, RE- 


void setgrent(void); 


«grp.h» p. 183 


int setgroups (int ngroups, const gid t grouplist[]) ; 


<grp.h> /* Linux */ p. 184 
<unistd.h> /* FreeBSD, Mac OS X, and Solaris */ 
返回 值 : FRH, Blo 车 出 错 ， 返 回 -1 


void sethostent(int sfayopen); 


«netdb.h» p. 597 


int setjmp(jmp buf eny); 


<setjmp.h> p. 215 
返回 值 ， 若 直接 调用 ， 返 回 0 4M longjmp 返回 ， 返 回 非 0 


int setlogmask(int maskpri); 


<syslog.h> p. 470 
返回 值 : 前 日 志 记录 优先 级 屏蔽 字 值 


void setnetent(int stayopen) ; 


«netdb.h» p. 598 


int setpgid (pid t pid, pid t pgid); 


«unistd.h» p. 294 
BEH: FRH, RE o Fit gE- 


int setpriority (int whick, id_t who, int value); 


<sys/resource.h> p. 277 
which: PRIO PROCESS. PRIO PGRP. PRIO_USER 
返回 值 : MW, 返回 0; xt, 返回 -1 


void setprotoent (int siayopen) ; 

<netdb.h> p. 598 
void satpwent (void); 

<pwd.h> p. 180 


int 


int 


int 


void 


pid t 


int 


void 


int 


int 


void 
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setregid(gid t rgid, gid t egid); 
«unistd.h» 


返回 值 : 若 成 功 ， 返 回 0; FHR, gE- 


setreuid(uid t ruid, uid t euid); 
«unistd.h» 


返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


setrlimit(int resource, const struct rlimit *rlptr); 
«sys/resource.h» 
resource: RLIMIT CORE, RLIMIT CPU, 
RLIMIT DATA, RLIMIT FSIZE, 
RLIMIT NOFILE. RLIMIT STACK, 
RLIMIT AS (FreeBSD 8.0. Linux 3.2.0. 
Solaris 10) , 
RLIMIT, MEMLOCK (FreeBSD 8.0. Linux 3.2.0. 
Mac OS X 10.6.8) , 
RLIMIT MSGQUEUE (Linux 3.2.0) , 
RLIMIT NICE (Linux3.2.0) , 
RLIMIT NPROC (FreeBSD 8.0. Linux 3.2.0. 
Mac OS X 10.6.8) , 
RLIMIT NPTS (FreeBSD 8.0) , 
RLIMIT RSS (FreeBSD 8.0. Linux 3.2.0. 
Mac OS X 10.6.8) , 
RLIMIT SBSIZE (FreeBSD 8.0) , 
RLIMIT SIGPENDING (Linux 3.2.0) , 
RLIMIT SWAP (FreeBSD 8.0) , 
RLIMIT VMEM (Solaris 10) 
返回 值 : 若 成 功 ， 返回 0; 若 出 错 ， 返回 -1 


setservent(int sfayopen); 
«netdb.h» 


setsid(void); 
«unistd.h» 


返回 值 ， 车 成 功 ， 返 回 进程 组 ID; 车 出 错 ， 返 回 -1 


setsockopt(int sock, int level, int option, const void *val, 
socklen t len); 
<sys/socket.h> 


返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 ~1 


setspent (void); 
«shadow.h» 
f: Linux 3.2.0. Solaris 10 


setuid(uid t uid); 
<unistd.h> 


返回 值 ， 若 成 功 ， 返 回 0: 若 出 错 ， 返 回 -1 


setvbuf (FILE *restrict fp, char *restrict buf, int mode, 
size t size); 
<stdio.h> 
mode: _IOFBF. IOLBF. IONBF 
返回 值 ; 若 成 功 ， 返 回 0 车 出 错 ， 返 回 非 0 


*shmat(int shmid, const void *addr, int flag); 
«sys/shm.h» 
flag: SHM RND. SHM RDONLY 


BA: 若 成 功 ， 返 回 指向 共享 存储 段 的 指针 ， 若 出 错 ， 返 回 -1 


p. 257 


p. 257 


p. 220 


p. 599 


p. 295 


p. 624 


p. 182 


p. 256 


p. 146 


p. 574 
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int shmctl(int shmid, int cmd, struct shmid ds *bwf); 
«sys/shm.h» p. 573 
cmd: IPC STAT, IPC SET, IPC RMID, 
SHM LOCK (Linux 3.2.0. Solaris 10) , 
SHM UNLOCK (Linux 3.2.0. Solaris 10) 
返回 值 : ARDY, BAO; 若 出 错 ， 返 回 -~1 


int shmdt (const void *addr); 
«sys/shm.h» p.574 
BE: ERW, Eo 若 出 错 ， 返 回 -1 

int shmget(key t key, size t size, int flag); 
€«sys/shm.h» p. 572 


flag: IPC CREAT. IPC EXCL 
BPA: 车 成 功 ， 返 回 非 负 共 享 存储 ID， 若 出 错 ， 返 回 -1 


int shutdown (int sock/d, int how); 
<sys/socket.h> p. 592 
how: SHUT RD. SHUT WR. SHUT RDWR 
BEH: 若 成 功 ， 返 回 0; 着 出 错 ， 返 回 -1 


int sig2str (int signo, char *str):; 
<signal.h> p. 380 
返回 值 : BR, REO: Awe, RE- 
平台 : Solaris 10 


int sigaction (int signo, const struct sigaction “restrict act, 
struct sigaction *restrict oact); 

<signal.h> p. 350 
返回 值 : FRH. Belo; EE, e-i 

int sigaddset(sigset t *sef, int signo); 
<signal.h> p. 344 
返回 值 ， 若 成 功 ， 返 回 0， 著 出 错 ， 返 回 -1 

int sigdelset(sigset t *set, int signo); 
<signal.h> p. 344 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 

int sigemptyset(sigset t *sen; 
<signal.h> p. 344 
返回 值 : 若 成 功 ， 返回 0; 若 出 错 ， 返回 -1 

int sigfillset(sigset t *sef); 
«signal.h» p. 344 
BEA: 若 成 功 ， 返 回 0; FHE, gE- 

int sigismember(const sigset t *sef, int sígmo); 
«signal.h» p.344 
返回 值 : 若 真 ， 返 回 1; #6, BO: 若 出 错 ， 返 回 -1 

void siglongjmp(sigjmp buf env, int val); 
<setjmp.h> p. 356 
此 函数 不 返回 

void (*signal (int signo, void (*fwnc) (int))) (int); 
<signal .h> p. 323 
EA: 若 成 功 ， 返 回 以 前 的 信号 处 理 配置 ; Bue. lel SIG ERR 

int sigpending(sigset t *set); 
<signal.h> p. 347 


返回 值 ， 若 成 功 ， 返 回 0;， 若 出 错 ， 返 回 -1 


int 


int 


int 


int 


int 


unsigned 


int 


int 


int 


int 


int 


int 


int 


int 


int 
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sigprocmask(int how, const sigset t *restrict set, 
sigset t *restrict oset); 
«signal.h» p. 346 
how: SIG BLOCK. SIG _ UNBLOCK、 SIG SETMASK 
返回 值 ， 车 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 


sigqueue (pid t pid, int signo, const union sigval value) 
«signal.h» p. 376 
返回 值 : ART, BIO; 若 出 错 ， 返 回 -1 


sigsetjmp(sigjmp buf env, int savemask); 
«setjmp.h» p. 356 
返回 值 : ARWAH, BFO: HA siglongjmp 调用 返回 ， 返 回 非 0 值 885 


sigsuspend(const sigset t *sigmask); 
<signal.h> p. 359 
AE: -1, errno RAX EINTR 


sigwait (const sigset t *restrict set, int *restrict signop); 
<signal.h> p. 454 
EEE: 若 成 功 ， 返 回 0， 和 否则， 返回 错误 编号 


sleep (unsigned int seconds); 
«unistd.h» p. 373 
BAA: 0 或 未 休眠 的 秘 数 


snprintf (char *restrict buf, size t n, 
const char *restrict format, ...); 
<stdio.h> p. 159 
返回 值 ， 若 缓冲 区 足够 大 ， 返 回 存 入 数组 的 字符 数 ; 若 编码 出 错 ， 返 回 负 值 


sockatmark (int sockfd); 
<sys/socket.h> p. 626 
返回 值 : 若 在 标记 处 ， 返 回 1， 若 没 在 标记 处 ， 返 回 0; 若 出 错 ， 返 回 -1 


socket (int domain, int type, int protocol): 
<sys/socket.h> p. 590 
type: SOCK STREAM. SOCK DGRAM. SOCK SEQPACKET 
REHE: 若 成 功 ， 返 回 文件 〈 套 接 字 ) 描述 符 ， 若 出 错 ， 返 回 -1 


socketpair(int domain, int type, int protocol, int sockfd[2]); 
«sys/socket.h» p. 630 
type: SOCK, STREAM. SOCK, DGRAM. SOCK SEQPACKET 
返回 值 : 车 成 功 ， 返回 0; 车 出 错 ， 返回 -1 


sprintf (char *restrict buf, const char *restrict format, ...); 
<stdio.h> p. 159 
返回 值 ， 若 成 功 ， 返 回 存 入 数组 的 字符 数 ; 车 编码 出 错 ， 返 回 负 值 


sscanf (const char *restrict buf, 
const char *restrict format, ...); 
«stdio.h» p. 162 
返回 值 : 研 值 的 输入 项 数 ， 若 输入 出 错 或 在 任 一 转换 前 已 到 达 文 件 尾 端 ， 返 回 EoF [886 


stat (const char *restrict path, struct stat *restrict buf); 
«sys/stat.h» p. 93 
返回 值 ， 若 成 功 ， 返回 0; Aus. 返回 -1 


str2sig(const char *sír, int *signop); 
«signal.h» p. 380 
返回 值 : 若 成 功 ， 返 回 0; 者 出 错 ， 返 回 -1 
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平台 ; Solaris 10 

char *strerror(int errnum); 
<string.h> p. 15 
EMA: PAWEL SBE 

size t strftime(char *restrict buf, size t maxsize, 


const char *restrict format, 

const struct tm *restrict tmptr); 
<time.h> p.192 
返回 值 ， 若 有 空间 ， 返 回 存 入 数组 的 字符 数 ; 否则， 返回 0 


size t strftime l(char *restrict buf, size t maxsize, 
const char *restrict format, 
const struct tm *restrict tmptr, locale t locale); 


«time.h» p.192 
BAG: 若 有 空间 ， 返 回 存 入 数组 的 字符 数 ， 和 否则 ， 返 回 0 

char *strptime (const char *restrict buf, const char *restrict format, 

struct tm *restrict fmptrr); 

<time.h> p. 195 
返回 值 : 指向 上 次 解析 的 字符 的 下 一 个 字符 的 指针 ;和 否则， 返回 NULL 

char *strsignal(int signe); 
<string.h> p. 380 
返回 值 : 说 明 该 信号 字符 串 的 指针 

int symlink(const char *actualpath, const char *sympath); 
<unistd.h> p. 123 
返回 值 ; AR, BO; FH, gE- 

int symlinkat(const char *actualpath, int fd, const char *sympath); 
«unistd.h» p. 123 
返回 值 ， 若 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 

void syne (void); 

887 <unistd.h> p. 81 
long sysconf (int name); 


<unistd.h> p. 42 
name: _SC_ARG MAX. SC ASYNCHRONOUS, IO. 
.SC ATEXIT MAX. _SC_BARRIERS, 
.SC CHILD MAX, SC CLK TCK. 
.SC CLOCK SELECTION. SC COLL WEIGHTS MAX. 
.SC DELAYTIMER MAX. SC HOST NAME MAX. 
.SC IOV MAX, SC JOB CONTROL. 
.SC LINE MAX. SC LOGIN NAME MAX. 
.SC MAPPED FILED. SC MEMORY PROTECTION. 
SC NGROUPS MAX. SC OPEN, MAX, 
.SC PAGESIZE. SC PAGE SIZE. 
.SC READER WRITER LOCKS. 
SC REALTIME SIGNALS. _SC_RE_DUP_MAX, 
.SC RTSIG MAX. SC SAVED IDS. 
.SC SEMAPHORES. SC SEM NSEMS MAX. 
SC, SEM VALUE MAX. SC SHELL. 
.SC SIGQUEUE MAX. SC SPIN LOCKS. 
.SC STREAM MAX. _SC SYMLOOP MAX, 
.SC THREAD SAFE FUNCTIONS. 
.SC THREADS. SC TIMER MAX, 
.SC TIMERS. SC TTY NAME MAX. 


void 


int 


int 


int 


int 


int 


pid t 


pid_t 


int 


int 


int 


long 


time_t 


clock_t 


.SC TZNAME MAX. _SC_VERSION, 
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.SC XOPEN CRYPT. SC, XOPEN, REALTIME. 
.SC XOPEN REALTIME THREADS. SC XOPEN SHM 


.SC XOPEN VERSION 
返回 值 ， 若 成 功 ， 返 回 相应 值 ， 著 出 错 ， 返 回 -1 


syslog(int priority, char *format, ...)3 
«syslog.h» 


system(const char *emdstring) ; 
<stdlib.h> 
BMA: shell 的 终端 状态 


tcdrain(int fd); 
«termios.h» 


返回 值 : 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


tcflow(int fd, int action); 
«termios.h» 
action: TCOOFF. TCOON, TCIOFF. TCION 
返回 值 ， 若 成 功 ， 返 回 0; 车 出 错 ， 返 回 -1 


tcflush(int fd, int queue); 
<termios.h> 
queue: TCIFLUSH. TCOFLUSH. TCIOFLUSH 
BH: AMI. lo: FHA, ge- 


tcgetattr(int fd, struct termios *fermpir); 
<termios.h> 


返回 值 : AR, EO; 若 出 错 ， 返 回 -! 


tegetpgrp (int fd); 
<unistd.h> 


p. 470 


p. 265 


p. 693 


p. 693 


p. 693 


p. 683 


p. 298 


AE: 若 成 功 ， 返 回 前 台 进 程 组 ID; EWW, gE- 


tcgetsid(int fd); 
<termios.h> 


p. 299 


返回 值 : 若 成 功 ， 返 回 会 话 首 进程 的 进程 组 ID， 若 出 错 ， 返 回 -1 


tcsendbreak(int fd, int duration); 
«termios.h» 


返回 值 : He, BGO: 若 出 错 ， 返 回 -1 


p. 693 


tesetattr (int fa, int opt, const struct termios ‘*fermptr); 


<termios.h> 
opt: TCSANOW. TCSADRAIN. TCSAFLUSH 
返回 值 ， 若 成 功 ， 返 回 0; 若 出 错 ， 返 回 -1 


tcsetpgrp(int fd, pid t pgrpid); 
«unistd.h» 


返回 值 : FRH., Eo: EHE. ae- 


telldir (DIR *dp); 
«dirent.h» 


返回 值 ， 与 dp 关联 的 目录 中 的 当前 位 置 


time(time t *calptr); 
«time.h» 


返回 值 ， 车 成 功 ， 返 回 时 间 值 ， 若 出 错 ， 返 回 --1 


times (struct tms *buf); 
<sys/times.h> 


p. 683 


p. 298 


p. 130 


p. 189 


p. 280 


返回 值 : 若 成 功 ， 经 过 的 墙 上 时 钟 时 间 ， 若 出 错 ， 返 回 -1 
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FILE 


char 


int 


char 


mode t 


int 


int 


int 


int 


int 


int 


int 


int 


int 


int 


*tmpfile(void); 
<stdio.h> 


返回 值 ， 车 成 功 ， 返 回 文件 指针 ， 若 出 错 ， 返 回 NULL 


*tmpnam(char *pir); 
<stdio.h> 


返回 值 ， 指 向 唯一 路 径 名 的 指针 ， 若 出 错 ， 返 回 NULL 


truncate(const char *path, off t length); 
<unistd.h> 


返回 值 ; 车 成 功 ， 返回 0; Tug. 返回 -1 


*ttyname(int fd); 
«unistd.h» 


返回 值 ， 指 向 终端 路 径 名 的 指针 ， 若 出 错 ， 返 回 NULL 


umask (mode t cmask) ; 
«sys/stat.h» 


返回 值 ， 之 前 的 文件 模式 创建 屏蔽 字 


uname {struct utsname *name); 
«sys/utsname.h» 


BREA: FRH. REENA: FHR, BE- 


ungetc(int c, FILE *fp); 
<stdio.h> 


BEHE: 若 成 功 ， 返 回 c; 若 出 错 ， 返 回 EOF 


unlink(const char *path); 
«unistd.h» 


BHE: RH, JRO: FAR, gH- 


unlinkat(int fd, const char *path, int flag); 
<unistd.h> 
flag: AT_REMOVEDIR 
返回 值 ， 若 成 功 ， 返 回 0: 车 出 错 ， 返 回 -1 


unlockpt (int fd); 
<stdlib.h> 
返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


unsetenv(const char *name); 
<stdlib.h> 
返回 值 ， 若 成 功 ， 返 回 0， 若 出 错 ， 返 回 -1 


utimensat(int fd, const char *path, 
const struct timespec íimes[2], int flag); 
«sys/stat.h» 
flag: AT SYMLINK NOFOLLOW 
返回 值 ; Xm. 返回 0; 车 出 错 ， 返回 -1 


utimes (const char *path, const struct timeval times[2]); 


«sys/time.h» 


返回 值 : ERIH, Eo FHA, gE- 


vdprintf (int fd, const char *restrict format, va list arg); 


«stdarg.h» 
<stdio.h> 


返回 值 : 若 成 功 ， 返 回答 出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


v£printf (FILE *restrict fp, const char *restrict format, 


va list arg); 


p. 167 


p.167 


p.112 


p. 695 


p. 104 


p.187 


p. 151 


p. 117 


p. 117 


p. 723 


p.212 


p. 126 


p. 127 


p. 161 
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附录 A” 函数 原型 719 


<stdarg.h> p. 161 
<stdio.h> 


BAG: 若 成 功 ， 返 回 输 出 字符 数 ， 若 输出 出 错 ， 返 回 负 值 


vfscanf(FILE *restrict I. const char *restrict format, va list arg); 
<stdarg.h> p. 163 
<stdio.h> 


返回 值 : 指定 的 输入 项 目 数 ， 若 输入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 EOF 


vprintf (const char *restrict format, va list arg): 
<stdarg.h> p. 161 
<stdio.h> 


返回 值 ， 若 成 功 ， 返 回 输出 字符 数 ; 若 输 出 出 错 ， 返 回 负 值 


vacanf (const char *restrict format, va list arg); 
<stdarg.h> p. 163 
<stdio.h> 


返回 值 : 指定 的 输入 项 目 数 ， 若 输入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 EOF 


vsnprintf (char *restrict buf, size t n, 
const char *restrict format, va list arg): 
<stdarg.h> p. 161 
<stdio.h> 


返回 值 : 若 缓冲 区 足够 大 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 


vsprintf (char *restrict buf, const char *restrict format, 
va list arg); 
<stdarg.h> p. 161 
<stdio.h> 


BEE: 若 成 功 ， 返 回 存 入 数组 的 字符 数 ， 若 编码 出 错 ， 返 回 负 值 


veseanf (const char *restrict buf, const char *restrict format, 
va list arg); 
«stdarg.h» p.163 
<stdio.h> 


返回 值 : 指定 的 输入 项 和 目 数 ， 考 输入 出 错 或 在 任 一 转换 前 文件 结束 ， 返 回 EOF 


vsyslog(int priority, const char *format, va list arg): 
<syslog.h> p. 472 
<stdarg.h> 
424: FreeBSD 8.0. Linux 3.2.0. Mac OS X 10.6.8. Solaris 10 


wait(int *statloc) ; 
<sys/wait.h> p. 238 
返回 值 : 车 成 功 ， 返 回 进程 ID; SHR. gE o0 或 -1 


waitid(idtype t idtype, id t id, siginfo t *infop, int options); 
«sys/wait.h» p. 244 
idtype: P. PID. P PGID. P ALL 
options: WCONTINUED. WEXITED. WNOHANG. WNOWAIT. WSTOPPED 
返回 值 ， 若 成 功 ， 返 回 0， 车 出错 ， 返 回 -1 


台 : Linux3.2.0. Solaris 10 


waitpid(pid t pid, int *statloc, int options); 
«sys/wait.h» p. 238 
options; WCONTINUED. WNOHANG. WUNTRACED 
返回 值 : 车 成 功 ， 返 回 进程 ID; 若 出 错 ， 返 回 0 或 -1 


wait3(int *statloc, int options, struct rusage *rusage); 
<sys/types.h> p. 245 
«sys/wait.h» 
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pid t 


Ssize t 


ssize t 


wait4 (pid t pid, int *statloc, int options, struct rusage *rusage); 


write(int fd, 


«sys/time.h» 

<sys/resource.h> 

options: WNOHANG, WUNTRACED 

返回 值 : 若 成 功 ， 返 回 进程 ID; 若 出 错 ， 返 回 0 或 -1 

平台 : FreeBSD 8.0, Linux 3.2.0. Mac OS X 10.6.8. Solaris 10 


«sys/types.h» 

<sys/wait.h> 

<sys/time.h> 

<sys/resource.h> 

options: WNOHANG. WUNTRACED 

BEE: ARH, BEHE ID: 若 出 错 ， 返 回 0 R- 

平台 : FreeBSD 8.0. Linux 3.2.0. Mac OS X 10.6.8, Solaris 10 


const void *buf, size t nbytes); 
«unistd.h» 


返回 值 ， 车 成 功 ， 返 回 已 写 的 字 节 数 ， 若 出 错 ， 返 回 -1 


writev(int fd, const struct iovec *iov, int iovcnt); 


<sys/uio.h> 


BE: #RH XxIBOSMEESEG Xmas gE- 


p. 245 


p. 72 


p. 521 
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B.1 本 书 使 用 的 头 文件 


本 书 中 的 大 多 数 程序 都 包含 头 文件 apue .h, 如 图 B-1 所 示 。 其 中 定义 了 常量 (如 MAXLINE) 
和 我 们 自 编 函数 的 原型 。 

大 多 数 程序 都 需要 包含 下 列 头 文件 : <staio.h>、<stdlib.h>《〈 其 中 有 exit BARA) 
和 <unistd.h>【〔 其 中 包含 所 有 标准 UNIX 函数 的 原型 )， 因 此 头 文 件 apue ,h 自动 包含 了 这 些 
系统 头 文 件 ， 同 时 还 包含 了 <string.h>。 这 样 就 减少 了 本 书 中 所 有 程序 的 长 度 。 
/* 
* Our own header, to be included before all standard system headers. 
wf 
#ifndef _APUE_H 
#define _APUE_H 


#define _POSIX_C_SOURCE 200809L 


Rif defined (SOLARIS) /* Solaris 10 */ 

#define _XOPEN_SOURCE 600 

telse 

#define _XOPEN_SOURCE 700 

#endif 

#include <sys/types.h> /* some systems still require this */ 
#include <sys/stat.h> 

#include <sys/termios.h> /* for winsize */ 
#if defined(MACOS) || !defined (TIOCGWINSZ) 

#include <sys/ioctl.h> 

#fendif 

#include <stdio.h> /* for convenience */ 

#include <stdlib.h> /* for convenience */ 

#include «stddef.h» /* for offsetof */ 

#include <string.h> /* for convenience */ 

#include <unistd.h> /* for convenience */ 

#include <signal.h> /* for SIG_ERR */ 

#define MAXLINE 4096 /* max line length */ 


/* 
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* Default file access permissions for new files. 


Xf 
#define FILE MODE (S IRUSR | S IWUSR | S IRGRP | S IROTH) 
/* 
* Default permissions for new directories. 
af 
#define DIR_MODE (FILE MODE | S_IXUSR | S IXGRP | S IXOTH) 
typedef void Sigfunc(int);/* for signal handlers */ 
$define min(a,b) ((a) < (b) ? (a) : (b)) 
#define max(a,b) ((a) > (b) ? (a) : (b)) 
/* 
* Prototypes for our own functions. 
"T 
char *path allocí(size t *); /* Figure 2.16 */ 
long open, max (void); /* Figure 2.17 */ 
int set cloexec(int):; /* Figure 13.9 */ 
void clr fl(int, int); 
void set fl(int, int); /* Figure 3.12 */ 
void pr_exit (int); /* Figure 8.5 */ 
void pr mask(const char *); /* Figure 10.14 */ 
Sigfunc *signal intr(int, Sigfunc *); /* Figure 10.19 */ 
void daemonize(const char *); /* Figure 13.1 */ 
void sleep us(unsigned int); /* Exercise 14.5 */ 
ssize_t readn(int, void *, size t); /* Figure 14.24 */ 
ssize t writen(int, const void *, size t); /* Figure 14.24 */ 
int fd pipe(int *); /* Figure 17.2 */ 
int recv fd(int, ssize t (*func) (int, 
const void *, size t));: /* Figure 17.14 */ 
int send fd(int, int); /* Figure 17.13 */ 
int send err(int, int, 
onst char *); /* Figure 17.12 */ 
int serv listen(const char *); /* Figure 17.8 */ 
int serv_accept (int, uid t *); /* Figure 17.9 */ 
int cli conn(const char *); /* Figure 17.10 */ 
int buf args(char *, int (*func) (int, 
char **)); /* Figure 17.23 */ 
int tty cbreak(int); /* Figure 18.20 */ 
int tty raw(int); /* Figure 18.20 */ 
int tty reset (int); /* Figure 18.20 */ 
void tty atexit(void); /* Figure 18.20 */ 
struct termios *tty_termios (void); /* Figure 18.20 */ 
int ptym_open(char *, int); /* Figure 19.9 */ 


int ptys open(char *); /* Figure 19.9 */ 


#ifdef 
pid_t 


#tendif 


int 


#define 


#tdefine 


#tdefine 


#define 


#define 


pid_t 
#define 


#define 


void 
void 
void 
void 
void 
void 
void 


void 
void 
void 
void 
void 
void 


void 
void 
void 
void 
void 


fendif 
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TIOCGWINSZ 
pty_fork(int *, char *, int, const struct termios *, 
const struct winsize *); /* Figure 19.10 */ 


lock reg(int, int, int, off t, int, off t); /* Figure 14.5 */ 


read lock(fd, offset, whence, len) ^ 

lock reg((fd), F SETLK, F RDLCK, (offset), (whence), (len)) 
readw lock(fd, offset, whence, len) \ 

lock,reg((fd), F SETLKW, F RDLCK, (offset), (whence), (len)) 
write lock(fd, offset, whence, len) \ 

lock reg((fd), F SETLK, F WRLCK, (offset), (whence), (len)) 
writew lock (fd, offset, whence, len) \ 

lock reg((fd), F SETLKW, F WRLCK, (offset), (whence), (len)} 
un lock(fd, offset, whence, len) \ 

lock reg((fd), F SETLK, F UNLCK, (offset), (whence), (len)) 


lock test (int, int, off t, int, off t); /* Figure 14.6 */ 


is read lockable(fd, offset, whence, len) \ 


(lock test((fd), F RDLCK, (offset), (whence), (len)) == 0) 
is write lockable(fd, offset, whence, len) \ 

(lock test((f£d), F WRLCK, (offset), (whence), (len)) == 0) 
err msg(const char *, ...); /* Appendix B */ 


err dump(const char *, ...) | attribute ((ínoreturn)); 

err quit(const char *, ...) attribute .((noreturn)); 
err_cont (int, const char *, ...); 

err exit(int, const char *, ...) attribute, ((noreturn)):; 
err ret(const char *, ...); 

err sys(const char *, ...) , attribute j((noreturn)); 


) 
) 


log msg(const char *, ...); /* Appendix B */ 897 
log open(const char *, int, int); 

log quit(const char *, ...) | attribute ((noreturn)); 

log_ret (const char *, ...); 

log sys(const char *, ...) |, attribute ((noreturn)); 

log exit(int, const char *, ...) | attribute ((noreturn)); 


TELL WAIT (void); /* parent/child from Section 8.9 */ 
TELL, PARENT (pid t); 

TELL, CHILD (pid t); 

WAIT PARENT (void); 

WAIT CHILD(void); 


/* _APUE_H */ 





B-1 头 文件 apue.h 


程序 中 先 包括 apue .h， 然 后 再 包括 一 般 系 统 头 文件 ， 这 样 就 使 我 们 易于 做 到 下 列 各 点 : 可 
以 先 定义 一 些 在 此 后 包括 的 头 文件 可 能 要 求 的 部 分 ， 能 够 控制 头 文件 被 包括 的 顺序 ， 能 够 重 定义 
某 些 部 分 ， 而 这 正 是 为 隐藏 两 个 系统 之 间 的 差别 而 需要 解决 的 。 
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B.2 标准 出 错 例 程 


我 们 提供 了 两 套 出 错 函数 ， 用 于 本 书 中 大 多 数 实例 以 处 理 各 种 出 错 情 况 。 一 套 以 err Fk, 
并 向 标准 错误 输出 一 条 出 错 消 息 。 另 一 套 以 1og_ 开 头 ， 用 于 守护 进程 〈 见 第 13 章 )， 它 们 多 半 
没有 控制 终端 。 

之 所 以 提供 我 们 自己 的 出 错 函 数 ， 是 为 了 能 够 编写 只 有 一 行 C 代码 的 出 错 处 理 程序 ， 例 如 : 


if {出 错 条 件 ) 
err dump ( 带 任意 参数 的 printf Hx); 


这 样 就 不 再 需要 使 用 下 列 代 码 : 


if (HBR) í 
char buf[200]; 


sprintf {buf， 带 任意 参数 的 printf 格式 ) ; 
perror (buf); 
abort(); 

} 


RTH h AREE AEA T. ISOC 的 变 长 参数 表 功 能 。 其 详细 说 明 见 Kemighan 和 
Ritchie[1988] 的 7.3 节 。 应 当 注 意 的 是 ， 这 个 ISO C 功能 与 早期 系统 (如 SVR3 和 4.3BSD) 提供 
的 varargs 功能 不 同 。 宏 的 名 字 相 同 ， 但 更 改 了 某 些 宏 的 参数 。 
B-2 列 出 了 各 个 出 错 函 数 之 间 的 区 别 。 


abort(); 
exit(1); 
return; 
exit(1l); 
return; 
exití1); 
return; 








err dump 









err exit 
err msg 
err quit 
err ret 
err sys 
err cont 







return; 
exit(2); 
return; 
exit (2); 
exit (2); 


log_msg 
log quit 
log ret 
log sys 
log exit 


Wm pm m ny nx|mm mm Mm on DA pu pn 


图 B-2 ”标准 出 错 函 数 
图 B-3 包括 了 输出 至 标准 错误 的 各 个 出 错 函 数 。 


#include "apue.h" 
#include <errno.h> /* for definition of errno */ 
#include <stdarg.h> /* ISO C variable aruments */ 


static void err_doit{int, int, const char *, va_list); 


/* 
* Nonfatal error related to a system call. 


B.2 


* Print a message and return. 
*/ 

void 

err ret(const char *fmt, 


{ 


| 


va list ap; 
va_start (ap, fmt); 
err doit(1, errno, fmt, ap); 


va endí(ap); 


/* 

* Fatal error related 
* Print a message and 
* 

void 

err sys(const char *fmt, ...) 
i 


to a system call. 
terminate. 


va list ap; 
va start(ap, fmt); 
err doit(l, errno, fmt, ap); 


va, end (ap) ; 
exit (1); 


/* 
* Nonfatal error unrelated to a system call. 
* Error code passed as explict parameter. 

* Print a message and return. 

*/ 

void 

err contí(int error, 


( 


const char *fmt, ...) 


va list ap; 
va start(ap, fmt); 
err doit(l, error, fmt, ap); 


va_end (ap); 


/* 
* Fatal error unrelated to a system call. 
* Error code passed as explict parameter. 
* Print a message and terminate. 

* 
void 
err_exit(int error, 


{ 


const char *fmt, ...) 


va list ap; 
va start(ap, fmt); 
err doit(1, error, fmt, ap); 


va, end (ap) ; 
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exit(1); 


/* 
* Fatal error related to a system call. 
* Print a message, dump core, and terminate. 


x 7 
void 
err dump(const char *fmt, ...) 
{ 
va_list ap; 


va_Start(ap, fmt); 

err doit(1l, errno, fmt, ap); 

va end(ap); 

abort():; /* dump core and terminate */ 
exit (1); /* shouldn't get here */ 


/* 
* Nonfatal error unrelated to a system call. 
* Print a message and return. 
€ 
void 
err msg(const char *fmt, ...) 
{ 


va_list ap; 


va start(ap, fmt); 
err doit(0, 0, fmt, ap); 
va_end (ap); 


/* 

* Fatal error unrelated to a system call. 
* Print a message and terminate. 

*/ 

void 

err quit(const char *fmt, ...) 

{ 


va list ap; 


va start(ap, fmt); 

err doit(0, 0, fmt, ap): 
va end(ap); 

exit(1); 


/* 

* Print a message and return to caller. 

* Caller specifies "errnoflag". 

*/ 

static void 

err_doit{int errnoflag, int error, const char *fmt, va_list 


{ 


ap) 
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char buf [MAXLINE]; 


vsnprintf(buf, MAXLINE-1, fmt, ap): 
if (errnoflag) 
snprintf(buf*strlen(buf), MAXLINE-strlen(buf)-1, ": %s", 
strerror(error)): 
strcat (buf, "Mn"); 


fflush(stdout); /* in case stdout and stderr are the same */ 
fputs (buf, stderr); 
fflush(NULL); /* flushes all stdio output streams */ 


B-3 ”输出 至 标准 错误 的 出 错 函 数 


B-4 包括 了 各 log_ xxx 出 错 函 数 。 若 进程 不 以 守护 进程 方式 运行 ， 那 么 调用 者 应 当 定 义 
变量 log to_stderr， 并 将 其 设置 为 非 0 值 。 在 这 种 情况 下 ， 出 错 消 息 被 发 送 至 标准 错误 。 阁 


log to stderr 标志 为 0， 则 使 用 syslog 设施 〈 见 13.4 节 )。 


/* 
* Error routines for programs that can run as a daemon. 
*/ 





#include "apue.h" 

#include <errno.h> /* for definition of errno */ 
#include <stdarg.h> /* ISO C variable arguments */ 
include <syslog.h> 


static void log doit(int, int, int, const char *, va list ap); 


/* 

* Caller must define and set this: nonzero if 
* interactive, zero if daemon 

*/ 

extern int log to stderr; 


/* 
* Initialize syslog(), if running as daemon. 
*/ 
void 
log_open(const char *ident, int option, int facility) 
{ 

if (log_to_stderr == 0} 

openlog(ident, option, facility); 


/* 

* Nonfatal error related to a system call. 

* Print a message with the system's errno value and return. 
x7 

void 

log_ret (const char *fmt, ...) 

{ 


va list ap; 


va_start(ap, fmt); 
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log doit(1, errno, LOG ERR, fmt, ap): 
va_end (ap); 


/* 
* Fatal error related to a system call. 
* Print a message and terminate. 


*/ 
void 
log sys(const char *fmt, ...) 
{ 
va_list ap; 


va_start(ap, fmt); 


log doit(1, errno, LOG_ERR, fmt, ap); 
va_end{ap); 
exit(2); 
} 
/* 


* Nonfatal error unrelated to a system call. 
* Print a message and return. 
of 

void 

log_msg(const char *fmt, ...) 

{ 


va_list ap; 


va start(ap, fmt); 
log doit(0, 0, LOG ERR, fmt, ap); 
va_end (ap); 


/* 
* Fatal error unrelated to a system call. 
* Print a message and terminate. 
tf 
void 
log quit(const char *fmt, ...) 
{ 


va list ap; 


va start(ap, fmt); 

log doit(0, 0, LOG ERR, fmt, ap); 
va end (ap); 

exit(2); 


* Fatal error related to a system call. 

* Error number passed as an explicit parameter. 
* Print a message and terminate. 

*/ 

void 

log exit(int error, const char *fmt, ...) 





va list ap; 


va start(ap, fmt); 

log doit(1, error, LOG ERR, fmt, ap); 
va end(ap); 

exit(2); 


/* 

* Print a message and return to caller. 

* Caller specifies "errnoflag" and "priority". 

*/ 

static void 

log doit(int errnoflag, int error, int priority, const char *fmt, 
va list ap) 


char buf [MAXLINE] ; 


vsnprintf (buf, MAXLINE-1, fmt, ap); 
if (errnoflag) 
snprintf (buf+strlen (buf), MAXLINE-strlen(buf)-1, ": %s", 
strerror(error)); 
strcat (buf, "\n"); 
if (log_to_stderr) { 
fflush (stdout); 
fputs (buf, stderr); 
fflush(stderr); 
) else { 
syslog(priority, "%s", buf); 
) 
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部 分 习题 答案 





第 1E 


1.1 


1.5 


这 个 习题 利用 1s(1) 命 令 的 下 面 两 个 参数 : -i 打印 文件 或 目录 的 i 节点 编号 (4.14 节 详 细 讨 
论 了 i 节点 ); -da 仅 打印 目录 信息 ， 而 不 是 打印 目录 中 所 有 文件 的 信息 。 
dur rie: 


$ 1s -ldi /etc/. /etc/.. -i 要 求 打 印 i 节点 编号 
162561 drwxr-xr-x 66 root 4096 Feb 5 03:59 /etc/./ 
2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /etc/../ 
$ 1s -ldi /. /.. .和 . .的 i 节点 编号 均 为 2 
2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /./ 


2 drwxr-xr-x 19 root 4096 Jan 15 07:25 /../ 
UNIX 系统 是 多 道 程 序 或 多 任务 系统 ， 所 以 ， 在 图 1-6 所 未 程序 运行 的 同时 其 他 两 个 进程 也 
在 运行 。 
因为 perror 的 msg 参数 是 一 个 指针 ，perror 就 可 以 改变 msg 指向 的 字符 串 。 然 而 使 用 
限定 符 const 限制 了 perror 不 能 修改 msg 指针 指向 的 字符 捉 。 而 对 于 strerror， 其 错 
误 号 参数 是 整数 类 型 ， 并 且 C 是 按 值 传递 所 有 参数 ， 因 此 即使 strerror 函数 想 修 改 参 数 
的 值 也 修改 不 了 ， 也 就 没有 必要 使 用 const 属性 。( 如 果 对 C 中 函数 参数 的 处 理 不 是 很 清 
楚 ， 可 参见 Kernighan 和 Ritchie[1988] 的 5.2 节 。) 
在 2038 年 。 将 time_t 数据 类 型 定 为 64 位 整 型 ， 就 可 以 解决 该 问题 了 。 如 果 它 现在 是 32 
位 整 型 ， 那 么 为 使 应 用 程序 正常 工作 ， 应 当 对 其 重 编译 。 但 是 这 一 问题 还 有 更 糟糕 之 处 。 
某 些 文件 系统 及 备份 介质 以 32 位 整 型 存放 时 间 。 对 于 这 些 同 样 需要 加 以 更 新 ， 但 又 需要 能 
读 旧 的 格式 。 
大 约 248 X. 


"San 


2.1 


下 面 是 FreeBSD 中 使 用 的 技术 。 在 头 文件 <machine/_types.h> 中 定义 可 在 多 个 头 文 件 中 
出 现 的 基本 数据 类 型 。 例 如 : 


#ifndef MACHINE TYPES H. 
#define MACHINE TYPES H. 


typedef int . int32 t; 
typedef unsigned int  . uint32 t; 


typedef _ uint32 t . size t; 
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#endif /* MACHINE TYPES H */ 
在 每 个 可 以 定义 基本 数据 类 型 size_t 的 头 文件 中 ， 包 含 下 面 的 语句 序列 。 


#ifndef SIZE T DECLARED 


typedef _ size t size_t; 
#define _SIZE_T_DECLARED 
#endif 


这 样 ， 实 际 上 只 执行 一 次 size_t 的 typedef. 
2.3 ”如 果 OPEN_MAX 是 未 确定 的 或 大 得 出 奇 ( 即 等 于 LONG_MAX)， 那 么 可 以 使 用 getrlimit 

得 到 每 个 进程 的 最 大 打开 文件 描述 符 数 。 因 为 可 以 修改 对 每 个 进程 的 限制 ， 所 以 我 们 不 能 

将 前 一 个 调用 得 到 的 值 高 速 缓存 起 来 〈 它 可 能 已 被 更 改 )， 见 图 C-1。 
*include "apue.n" 


#include «limits.h» 
#include <sys/resource.h> 


#define OPEN MAX GUESS 256 


long 

open, max (void) 

{ 
long openmax; 
struct rlimit rl; 


if ((openmax = sysconf( SC OPEN MAX)) < 0 || 
openmax == LONG MAX) { 
if (getrlimit(RLIMIT NOFILE, &rl) < 0) 
err sys("can't get file limit"); 
if (rl.rlim max -- RLIM INFINITY) 
openmax - OPEN MAX GUESS; 
else 
openmax - rl.rlim max; 
} 


return (openmax) ; 
C-1 标识 最 大 可 能 文件 描述 符 的 替换 方法 


第 3 章 


3.1 ”所 有 磁盘 VO 都 要 经 过 内 核 的 块 缓存 区 〈 也 称 为 内 核 的 缓冲 区 高 速 缓存 )。 唯 一 例外 的 是 对 
原始 磁盘 设备 的 IO， 但 是 我 们 不 考虑 这 种 情况 (Bach[1986] 的 第 3 章 讲 述 了 这 种 缓存 区 高 
速 缓存 的 操作 )。 既 然 read 或 write 的 数据 都 要 被 内 核 缓冲 ， 那 么 术语 “不 带 缓冲 的 DO" 
指 的 是 在 用 户 的 进程 中 对 这 两 个 函数 不 会 自动 缓冲 ， 每 次 read 或 write 就 要 进行 一 次 系 
统 调用 。 

3.3 ”每 次 调用 open 函数 就 分 配 一 个 新 的 文件 表 项 。 但 是 因为 两 次 打开 的 是 同一 个 文件 , 则 两 个 
文件 表 项 指向 相同 的 v 节点 。 调 用 dup 引用 己 存 在 的 文件 表 项 〈 此 处 指 fdal 的 文件 表 项 )， 
见 图 C-2. 34 F SETFD 作用 于 fai 时 ， 只 影响 fal 的 文件 描述 符 标志 ; F_SETFL 作用 于 
fdi 时 ， 则 影响 fal 及 fq2 指向 的 文件 表 项 。 
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3.4 


3.5 


3.6 





进程 表 项 文件 表 


; 文件 状态 标志 
当前 文件 偏 移 基 
v 节点 指针 












图 C-2 open 和 dup 的 结果 
如 果 £d 1, PAT sup2 (ftd，1) 后 返回 1， 但 没有 关闭 文件 描述 符 1 (93.12 节 )。 调 用 
3 次 dup2 后 ，3 个 描述 符 指 向 相同 的 文件 表 项 ， 所 以 不 需要 关闭 描述 符 。 
如 果 fd 为 3， 调 用 3 次 dup2 后 ， 有 4 个 描述 符 指向 相同 的 文件 表 项 ， 这 种 情况 下 就 需要 
关闭 描述 符 3。 
因为 shell 从 左 到 右 处 理 命 令 行 ， 所 以 


./a.out > outfile 2>&1 


首先 设置 标准 输出 到 out file， 然 后 执行 dup 将 标准 输出 复制 到 描述 符 2 (标准 错误 ) 上 ， 
其 结果 是 将 标准 输出 和 标准 错误 设置 为 同一 个 的 文件 ， 即 描述 符 1 和 2 指向 同一 个 文件 表 
项 。 而 对 于 命令 行 


./a.out 2»&1 > outfile 


由 于 首先 执行 dup， 所 以 描述 符 2 成 为 终端 (假设 命令 是 交互 执行 的 )， 标 准 输 出 重 定向 到 
outfile。 结 果 是 描述 符 1 指向 outfile 的 文件 表 项 ， 描 述 符 2 指向 终端 的 文件 表 项 。 

这 种 情况 下， 仍然 可 以 用 1seek 和 read 函数 读 文件 中 任意 一 个 位 置 的 内 容 。 但 是 write 
函数 在 写 数据 之 前 会 自动 将 文件 偏 移 量 设置 为 文件 尾 ， 所 以 写 文件 时 只 能 从 文件 尾 端 开始 。 
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4.1 


4.2 


4.3 


stat 函数 总 是 跟随 符号 链接 ( 见 图 4-170, 所 以 该 程序 决 不 会 显示 文件 类 型 是 “符号 链接 ”。 
例如 ， 正 如 本 书 正文 中 所 示 ，/dGev/cdrom 是 /dev/sr0 的 一 个 符号 链接 ， 但 是 stat Ñ 
数 的 结果 只 显示 /dev/cdrom 是 一 个 块 特殊 文件 ， 而 不 报告 它 是 一 个 符号 链接 。 阁 符号 链 
接 指向 一 个 不 存在 的 文件 ，stat 会 出 错 返回 。 

将 关闭 该 文件 的 所 有 访问 权限 。 


$ umask 777 
$ date » temp.foo 


---------- l sar 29 Feb 5 14:06 temp.foo 
下 面 的 命令 显示 了 关闭 用 户 读 权 限时 所 发 生 的 情况 。 


$ data > foo 
$ chmod u-r foo 关闭 用 户 读 权限 
$ ls -1 foo 验证 文件 的 权限 
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--W-r--r-- 1 sar 29 Feb 5 14:21 foo 
$ cat foo 读 文 件 


cat: foo: Permission denied 
44 ”如 果 用 open 或 creat 创建 已 经 存在 的 文件 ， 则 该 文件 的 访问 权限 位 不 变 。 运 行 图 4-9 中 
的 程序 可 以 验证 这 点 。 
$ rm foo bar 删除 文件 
$ data > foo 创建 文件 


$ data » bar 
$ chmod a-r foo bar 关闭 所 有 的 读 权 限 


$ 1s -l foo bar 验证 其 权限 
--W------- l sar 29 Feb 5 14:25 bar 
--W------- l sar 29 Feb 5 14:25 foo 
$ ./a.out 运行 图 4-0 程序 

$ 1s -1 foo bar 检查 文件 的 权限 和 大 小 
一 一 W 一 一 一 一 一 一 ~ 1 sar 0 Feb 5 14:26 bar 
--W------—-— 1 sar 0 Feb 5 14:26 foo 


可 以 看 出 访问 权限 没有 改变 ， 但 是 文件 被 截断 了 。 

4.5 ”目录 的 长 度 从 来 不 会 是 0， 因为 它 总 是 包含 .和 . .两 项 。 符 号 链接 的 长 度 指 其 路 径 名 包含 的 
字符 数 ， 由 于 路 径 名 中 至 少 有 一 个 字符 ， 所 以 长 度 也 不 为 0。 

47 ” 当 创 建新 的 core 文件 时 ， 内 核对 其 访问 权限 有 一 个 默认 设置 ， 在 本 例 中 是 rw-r--r--。 这 
一 默认 值 可 能 会 也 可 能 不 会 被 umask 的 值 修改 。shell 对 创建 的 重 定向 的 新 文件 也 有 一 个 默 
认 的 访问 权限 , 本 例 中 为 rw-rw-rw-, 这 个 值 总 是 被 当前 的 umask 修改 , 在 本 例 中 umask 
为 02。 

4.8 ”不 能 使 用 du 的 原因 是 它 需要 文件 名 ， 如 


du tempfile 


或 目录 名 ， 如 
Qu . 


只 有 当 unlink 函数 返回 时 才 释 放 tempfile 的 目录 项 ，du .命令 没有 计算 仍然 被 
tempfile 占用 的 空间 。 本 例 中 只 能 使 用 df 命令 查看 文件 系统 中 实际 可 用 的 空闲 空间 。 

4.9 ”如 果 被 删除 的 链接 不 是 该 文件 的 最 后 一 个 链接 ， 则 不 会 删除 该 文件 。 此 时 ， 文 件 的 状态 更 
改 时 间 被 更 新 。 但 是 ， 如 果 被 删除 的 链接 是 最 后 一 个 链接 ， 则 该 文件 将 被 物理 删除 。 这 时 
再 去 更 新 文件 的 状态 更 改 时 间 就 没有 意义 , 因为 包含 文件 所 有 信息 的 i 节点 将 会 随 着 文件 的 
删除 而 被 释放 。 

410 用 opendir 打开 一 个 目录 后 ， 递 归 调 用 函数 dopath。 假 设 opendir 使 用 一 个 文件 描述 
符 ， 并 且 只 有 在 处 理 完 目录 后 才 调 用 closedir 释放 描述 符 ， 这 就 意味 着 每 次 降 一 级 就 要 
使 用 另外 一 个 描述 符 。 所 以 进程 可 打开 的 最 大 描述 符 数 就 限制 了 我 们 可 以 遍历 的 文件 系统 
树 的 深度 。Single UNIX Specification 的 XSI 扩展 中 说 明 的 ftw 允许 调用 者 指定 使 用 的 描述 
符 数 ， 这 隐 含 着 可 以 关闭 描述 符 并 且 重 用 它们 。 

4.12 chroot 本 数 被 因特网 文件 传输 协议 (nternet File Transfer Protocol, FTP) 程序 用 于 辅助 安 
全 性 。 系 统 中 没有 账户 的 用 户 〈 也 称 为 匿名 FIP) 放 在 一 个 单独 的 目录 下 ， 利 用 chroot 
将 此 目录 当 作 新 的 根 目 录 ， 就 可 以 阻止 用 户 访问 此 目录 以 外 的 文件 。 
chroot 也 用 于 在 男 一 台 机 器 上 构造 一 个 文件 系统 层次 结构 的 副本 , 然后 修改 此 副本 , 不 会 
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4.15 


4.16 
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更 改 原来 的 文件 系统 。 这 可 用 于 测试 新 软件 包 的 安装 。 

chroot 只 能 由 超级 用 户 执行 , 一旦 更 改 了 一 个 进程 的 根 ， 该 进程 及 其 后 代 进 程 就 再 也 不 能 
首先 调用 stat 函数 取得 文件 的 3 个 时 间 值 ， 然 后 调用 utimes 设置 期 望 的 值 。 在 调用 
utimes 时 我 们 不 希望 改变 的 值 应 当 是 stat 中 相应 的 值 。 

finger(1) 对 邮箱 调用 stat 函数 ， 最 近 一 次 的 修改 时 间 是 上 一 次 接收 邮件 的 时 间 ， 最 近 访 
问 时 间 是 上 一 次 读 邮 件 的 时 间 。 

cpio 和 tar 存储 的 只 是 归档 文件 的 修改 时 间 (st_mtim)。 因 为 文件 归档 时 一 定 会 读 它 ， 
所 以 该 文件 的 访问 时 间 对 应 于 创建 归档 文件 的 时 间 , 因此 没有 存储 其 访问 时 间 。cpio 的 -a 
选项 可 以 在 读 输入 文件 后 重新 设置 该 文件 的 访问 时 间 ， 于 是 创建 归档 文件 不 改变 文件 的 访 
问 时 间 。( 但 是 ， 重 置 文件 的 访问 时 间 确 实 改变 了 状态 更 改 时 间 。) 状态 更 改 时 间 没 有 存储 
在 文 挡 上 ， 因 为 即使 它 曾 被 归档 ， 在 抽取 时 也 不 能 设置 其 值 。(utimes 函数 极其 相关 的 
futimens 和 utimensta 函数 可 以 更 改 的 仅仅 是 访问 时 间 和 修改 时 间 。) 

对 tar 来 说 ， 在 抽取 文件 时 ， 其 默认 方式 是 复原 归档 时 的 修改 时 间 值 ， 但 是 tar 的 -m 选 
项 则 将 修改 时 间 设 置 为 抽取 文件 时 的 时 间 ， 而 不 是 复原 归档 时 的 修改 时 间 值 。 对 于 tar, 
无 论 何 种 情况 ， 在 抽取 后 ， 文 件 的 访问 时 间 均 是 抽取 文件 时 的 时 间 。 

另 一 方面 ，cpio 将 访问 时 间 和 修改 时 间 设 置 为 抽取 文件 时 的 时 间 。 默 认 情 况 下 ， 它 并 不 试 
图 将 修改 时 间 设 置 为 归档 时 的 值 。cpio 的 -m 选项 将 文件 的 修改 时 间 和 访问 时 间 设 置 为 归 
档 时 的 值 。 

内 核对 目录 树 的 深度 没有 内 在 的 限制 , 但 是 如 果 路 径 名 的 长 度 超出 了 PATH_MAX, 则 有 许多 
命令 会 失败 。 图 C-3 程序 创建 了 一 个 深度 为 1 000 的 目录 树 ， 每 一 级 目录 名 有 45 个 字符 。 
在 所 有 平台 上 我 们 都 能 构建 这 样 的 结构 , 但 并 不 是 在 所 有 平台 上 都 能 用 getcwd 得 到 第 
1000 级 目录 的 绝对 路 径 名 。 在 Mac OS X 10.6.8 中 ， 当 到 达 长 路 径 的 目录 尾部 时 ，getcwd 
就 不 再 成 功 了 。 在 FreeBSD 8.0、Linux 3.2.0 和 Solaris 10 中 ，getcwd 可 以 获得 路 径 名 ， 但 
是 需要 多 次 调用 realloc 得 到 一 个 足够 大 的 缓冲 区 。 在 Linux 3.2.0 上 运行 该 程序 后 得 到 : 
$ ./a.out 
getcwd failed, size - 4096: Numerical result out of range 

getcwd failed, size - 4196: Numerical result out of range 

"n 省 略 了 418 1T 

getcwd failed, size = 45896: Numerical result out of range 
getcwd failed, size - 45996: Numerical result out of range 


length - 46004 
显示 46004 字 节 的 路 径 名 


然而 ， 不 能 用 cpio 归档 此 目录 ， 因 为 文件 名 太 长 了 。 事 实 上 ，cpio 在 所 有 4 种 平台 上 都 不 
能 归档 此 目录 。 于 此 对 比 的 是 ， 在 FreeBSD 8.0、Linux 3.2.0 和 Mac OS X 10.6.8 上 ， 可 以 用 
tar 归档 此 目录 。 然 而 ， 在 Linux 3.2.0 上 ， 我 们 不 能 从 归档 文件 中 抽取 出 目录 的 层次 结构 。 


#include "apue.h" 
#include «fcntl.h» 


#define DEPTH 1000 /* directory depth */ 
define STARTDIR "/tmp" 
define NAME "alonglonglonglonglonglonglonglonglonglongname" 


#define MAXSZ (10*8192) 
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int 
main(void) 


{ 


int i; 
size_t size; 
char *path; 


if (chdir(STARTDIR) « 0) 
err sys("chdir error"); 


for (i = 0; i < DEPTH; i++) { 
if (mkdir(NAME, DIR MODE) < 0) 
err Sys("mkdir failed, i = $d", i); 
if (chdir(NAME) < 0} 
err Sys("chdir failed, i - $d", 1); 


} 


if (creat("afile", FILE MODE) < 0) 
err sys("creat error"); 


/* 
* The deep directory is created, with a file at the leaf. 
* Now let's try to obtain its pathname. 


*/ 
path = path allocí(&size); 
for (7 7 ) ( 
if (getcwd(path, size) != NULL) { 
break; 
) else ( 


err ret("getcwd failed, size = tid", (long)size); 
size += 100; 
if (size » MAXSZ) 
err quit("giving up"); 
if ((path = realloc(path, size)) -- NULL) 
err sys("realloc error"); 
} 
} 
printf("length = $lda\n%s\n", (long)strlen(path), path); 


exití(0); 
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417 /dev 目录 关闭 了 一 般 用 户 的 写 访 问 权 限 ， 以 防止 普通 用 户 删除 目录 中 的 文件 名 。 这 就 意味 
着 unlink KK. 


^S D RE 


52 fgets 函数 读 入 数据 ， 直 到 行 结束 或 缓冲 区 满 (当然 会 留 出 一 个 字 节 存放 终止 null 字 节 )。 
同样 ，fputs 只 负责 将 缓冲 区 的 内 容 输出 直到 遇 到 一 个 null 字 节 ， 而 并 不 考虑 缓冲 区 中 是 
否 包 含 换行 符 。 所 以 ， 如 果 将 MAXLINE 设 得 很 小 ， 这 两 个 函数 仍然 会 正常 工作 ;只 不 过 在 
缓冲 区 较 大 时 ， 函 数 被 执行 的 次 数 要 多 于 MAXLINE 值 设置 得 较 大 的 时 候 。 
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如 果 这 些 函 数 删 除 或 添加 换行 符 〈 如 gets 和 puts AAKRE), WORRENT REN 

行 ， 缓 冲 区 也 足够 大 。 

24 printf 没有 输出 任何 字符 时 ， 如 printf ("") :， 函 数 调用 返回 0。 

这 是 一 个 比较 常见 的 错误 。 gete 以 及 getchar 的 返回 值 是 int 类 型 , 而 不 是 char 类 型 。 

由 于 EOF 经 常 定义 为 一 1, 那么 如 果 系 统 使 用 的 是 有 符号 的 字符 类 型 , 程序 还 可 以 正常 工作 。 

但 如 果 使 用 的 是 无 符号 字符 类 型 ， 那 么 返回 的 EOF 被 保存 到 字符 c 后 将 不 再 是 一 1， 所 以 ， 

程序 会 进入 死 循 环 。 本 书 说 明 的 4 种 平台 都 使 用 带 符号 字符 ， 所 以 实例 代码 都 能 工作 。 

5.5 (AKA: SVR fflush 后 调用 fsync。fsync 所 使 用 的 参数 由 fileno 函数 获得 。 
如 果 不 调用 ffLush， 所 有 的 数据 仍然 在 内 存 缓冲 区 中 ,此 时 调用 fsync 将 没有 任何 效果 。 

5.66 “ 当 程 序 交 互 运行 时 ， 标 准 输入 和 标准 输出 均 为 行 缓冲 方式 。 每 次 调用 fgets 时 标准 输出 设 
备 将 自动 神 洗 。 

5.7 ”基于 BSD 系统 的 fmemopen 的 实现 如 图 C-4 所 示 。 

#include <stdio.h> 

#include <stdlib.h> 


#include <string.h> 
#include <errno.h> 





/* 
* Our internal structure tracking a memory stream 
*/ 
struct memstream 
{ 
char *buf; /* in-memory buffer */ 
size t rsize; /* real size of buffer */ 


size t vsize;  /* virtual size of buffer */ 
size t curpos; /* current position in buffer */ 


int flags; /* see below */ 
E 
/* flags */ 
#define MS READ 0x01 /* open for reading */ 
&define MS WRITE 0x02 /* open for writing */ 
#define MS APPEND 0x04 /* append to stream */ 
#define MS TRUNCATE 0x08 /* truncate the stream on open */ 
#define MS MYBUF 0x10 /* free buffer on close */ 


#ifndef MIN 
#define MIN(a, b) ((a) < (b) ? (a) : (b)) 
#Hendif 


static int mstream_read(void *, char *, int); 

static int mstream_write(void *, const char *, int); 
static fpos t mstream seek(void *, fpos t, int); 
static int mstream close(void *); 

static int type to flags(const char * restrict type); 
static off t find end(char *buf, size t len); 
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FILE * 
fmemopen(void * restrict buf, size t size, 
const char * restrict type) 


struct memstream *ms; 
FILE *fp; 


if (size == 0) ( 
errno = EINVAL; 
return (NULL); 
} 
if ((ms = malloc(sizeofí(struct memstream))) == NULL) [ 
errno = ENOMEM; 
return (NULL) ; 
} 
if ((ms->flags = type to flags(type)) == 0) { 
errno = EINVAL; 
free (ms); 
return (NULL) ; 
} 
if (buf == NULL) { 
if ((ms->flags & (MS READ|MS WRITE)) !- 
(MS READ|MS WRITE)) { 
errno = EINVAL; 
free (ms); 
return (NULL); 
) 
if ((ms->buf = malloc(size)) == NULL) { 
errno = ENOMEM; 
free (ms); 
return (NULL) ; 
} 
ms->rsize = size; 
ms->flags |= MS_MYBUF; 
ms-»curpos = 0; 
} else { 
ms-»buf = buf; 
ms-»rsize = size; 
if (ms->flags & MS, APPEND) 
ms-»curpos = find end(ms-»buf, ms-»rsize); 
else 
ms->curpos = 0 


^s. 


] 

if (ms-»flags & MS APPEND) | /* "a" mode */ 
ms-»vsize = ms-»curpos; 

} else if (ms->flags & MS TRUNCATE) { /* "w" mode */ 
ms-»vsize = 0; 

) else ( /* "r" mode */ 
ms-»vsize - size; 

} 

fp = funopen(ms, mstream_read, mstream_write, 

mstream seek, mstream close); 

if (fp == NULL) { 

if (ms->flags & MS MYBUF) 
free (ms-»buf); 

free (ms); 

) 


return (fp); 
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static int 
type to flags(const char * restrict type) 
{ 

const char *cp; 

int flags = 0; 


for (cp = type; *cp != 0; cptt+) | 
switch (*cp) { 
case 'r': 
if (flags != 0) 


return (0); /* error */ 
flags |= MS_READ; 
break; 

case 'w': 

if (flags != 0) 

return(0); /* error */ 
flags |= MS WRITE|MS TRUNCATE; 
break; 


case 'a': 
if (flags !- 0) 


return(0); /* error */ 
flags |= MS APPEND; 
break; 
case '+': 
if (flags == 0) 
return(0); /* error */ 
flags |= MS, RÉAD|MS WRITE; 
break; 
case 'b': 
if (flags == 0) 
return(0); /[* error */ 
break; 
default: 
return(0); /* error */ 


) 


return (flags); 


static off_t 
find end(char *buf, size t len) 


i 
off t off = 0; 


while (off < len) [| 
if (buf[off] == 0) 
break; 
offt*; 


} 
return(ioff); 


Static int 
mstream_read(void *cookie, char *buf, int len) 


{ 


int nr; 
struct memstream *ms = cookie; 


if (!(ms->flags & MS_READ)) { 
errno = EBADF; 
return (-1); 

} 

if (ms->curpos >= ms-»vsize) 
return (0); 


/* can only read from curpos to vsize */ 
nr = MIN(len, ms->vsize - ms-»curpos); 
memcpy (buf, ms->buf + ms-»curpos, nr); 
ms-»curpos += nr; 

return (nr)? 


static int 
mstream write(void *cookie, const char *buf, int 


{ 


int nw, off; 
struct memstream *ms = cookie; 


if (!(ms->flags & (MS APPEND|MS WRITE))) { 
errno - EBADFE; 
return (-1); 
} 
if (ms->flags & MS_APPEND) 
off = ms->vsize; 
else 
off = ms->curpos; 
nw = MIN(len, ms-»rsize - off); 
memcpy (ms->buf + off, buf, nw); 
ms->curpos = off + nw; 
if (ms->curpos > ms->vsize) I 
ms->vsize = ms-»curpos; 
if (((ms-»flags & (MS READ|MS WRITE)) == 
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len) 


(MS READ|IMS WRITE)) && (ms->vsize < ms-»rsize)) 


*(ms-»buf + ms->vsize) = 0; 
) 
if ((ms->flags & (MS WRITE|MS APPEND)) && 
!(ms-»flags & MS READ)) { 
if (ms->curpos < ms-»rsize) 
*(ms->buf + ms-»curpos) = 0; 
else 
*(ms-»buf + ms-»rsize - 1) = 0; 
] 


returnínw); 
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) 


Static fpos t 
mstream seek(void *cookie, fpos t pos, int whence) 
( 

int off; 

struct memstream *ms - cookie; 


switch (whence) { 

case SEEK SET: 
off = pos; 
break; 

case SEEK, END: 
off = ms->vsize + pos; 
break; 

case SEEK CUR: 
off = ms-»curpos + pos; 
break; 

} 

if (off < 0 || off > ms->vsize) { 
errno = EINVAL; 
return -1; 

) 

ms-»curpos - off; 

return(off); 

} 


static int 
mstream_close (void *cookie) 
{ 


struct memstream *ms = cookie; 


if (ms->flags & MS_MYBUF) 
free (ms->buf); 

free(ms); 

return (0); 


图 C-4 BSD 系统 的 fmemopen 实现 
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6.1 63 节 讲述 了 在 Linux 和 Solaris 系统 中 访问 阴影 口令 文件 的 函数 。 不 能 使 用 6.2 节 所 述 函 数 
返回 的 pw_passwd 字段 值 与 加 密 口令 相 比 较 ， 因为 此 字段 不 是 加 密 的 口令 。 正确 的 方法 是 
使 用 阴影 口令 文件 中 对 应 用 户 的 加 密 口令 字段 来 进行 比较 。 
在 FreeBSD 和 Mac OS X 中 ,口令 文件 的 阴影 是 自动 建立 的 。FreeBSD 8.0 中 ， 仅 当 调 用 者 
的 有 效用 户 ID 为 0 时 ,getpwnam 或 getpwuid 函数 返回 的 passed 结构 中 的 pw_passwd 
字段 包含 有 加 密 口令 。 在 Mac OS X10.68 上 ， 加 密 口 令 不 能 通过 这 些 接口 访问 。 

6.2 TE Linux 3.2.0 和 Solaris 10 中 ， 图 C-5 程序 输出 加 密 口令 。 当 然 ， 除 非 有 超级 用 户 权 限 ， 否 
则 调用 getspnam 将 返回 EACCES 错误 。 


#include "apue.n" 
#include <shadow.h> 
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int 
main (void) /* Linux/Solaris version */ 
{ 

struct spwd  *ptr; 


if ((ptr = getspnam("sar")) == NULL) 
err sys("getspnam error"); 
printf("sp pwdp = %s\n", ptr-»sp pwdp == NULL || 
ptr-»sp pwdp[0] == 0 ? "(null)" ; ptr->sp_pwdp); 
exit(0); 


图 C-5 Æ Linux 和 Solaris 系统 中 输出 加 密 口令 
在 FreeBSD 8.0 中 ， 具 有 超级 用 户 权 限时 ， 图 C-6 程序 将 输出 加 密 口令 ， 否 则 pw_passed 
的 返回 值 为 星 号 (*)。 在 Mac OS X 10.6.8 H, 不 管 其 运行 时 的 用 户 权限 是 什么 都 输出 星 号 。 


#include "apue.h" 
#include <pwd.h> 


int 
main (void) /* FreeBSD/Mac OS X version */ 
{ 

struct passwd *ptr; 

if ((ptr = getpwnam("sar")) == NULL) 


err Sys("getpwnam error"); 
printf("pw passwd = %s\n", ptr-»pw passwd == NULL || 
ptr-»pw passwd[0] == 0? "(null)" : ptr->pw_passwd); 
exit (0); 


| C-6 在 FreeBSD 和 Mac OS X 中 输出 加 密 口令 
65 ”图 C-7 程序 以 类 似 于 date 命令 的 格式 输出 日 期 。 


$include "apue.h" 
#include «time.h» 


int 

main(void) 

{ 
time_t caltime; 
struct tm *tm; 
char line[MAXLINE]; 


if ((caltime = time(NULL)) == -1) 
err sys("time error"); 

if ((tm = localtime(&caltime)) == NULL) 
err sys("localtime error"); 

if (strftime(line, MAXLINE, "ta tb $d $X $2 $YWn", tm) == 0) 
err sys("strftime error"); 

fputs(line, stdout); 

exit (0); 





C-7 以 date(1) 的 格式 输出 日 期 和 时 间 
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图 C-7 中 程序 的 运行 结果 如 下 : 


S ./a.out 作者 的 默认 格式 是 美国 东部 
Wed Jul 25 22:58:32 EDT 2012 

$ TZ-US/Mountain ./a.out 美国 山地 时 间 

Wed Jul 25 20:58:32 MDT 2012 

$ T2-Japan ./a.out 日 本 


Thu Jul 26 11:58:32 JST 2012 


第 7 章 
7.1 ”原因 在 于 printf 的 返回 值 〈 输 出 的 字符 数 ) 变 成 了 main 函数 的 返回 值 。 为 了 验证 这 一 


7.10 


结论 ， 改 变 打印 字符 串 的 长 度 ， 然 后 运行 程序 ， 查 看 返回 值 是 否 与 新 的 字符 串 长 度 值 匹配 。 
当然 ， 并 不 是 所 有 的 系统 都 会 出 现 该 情况 。 还 要 注意 的 是 ， 如 果 在 gec 中 人 允许 ISO C 扩展 
的 编译 选项 ， 返 回 值 将 总 是 0， 这 是 标准 要 求 的 。 

当 程 序 处 于 交互 运行 方式 时 ， 标 准 输出 通常 处 于 行 缓冲 方式 ， 所 以 当 输 出 换行 符 时 ， 上 次 
的 结果 才 被 真正 输出 。 如 果 标 准 输 出 被 定向 到 一 个 文件 ， 而 标准 输出 处 于 全 缓冲 方式 ， 则 
当 标 准 LO 清理 操作 执行 时 ， 结 果 才 真正 被 输出 。 

由 于 agrc 和 argv 的 副本 不 像 environ 一 样 保 存在 全 局 变量 中 ， 所 以 在 大 多 数 UNIX 系 
统 中 没有 其 他 办 法 。 

当 C 程序 解 引用 一 个 空 指针 出 错时 ， 执行 该 程序 的 进程 将 终止 。 可 以 利用 这 种 方法 终止 
进程 。 

定义 如 下 ， 


typedef void Exitfunc(void); 
int atexit(Exitfunc *func); 


calloc 将 分 配 的 内 存 空间 初始 化 为 0。 但 是 ISO C 并 不 保证 0 BSAA 0 或 空 指针 的 值 
相同 。 

只 有 通过 exec 函数 执行 一 个 程序 时 ， 才 会 分 配 堆 和 栈 〈( 见 8.10 1). 

可 执行 文件 (a .out) 包含 了 用 于 调试 core MENS RAR. A strip(1) 命 令 可 以 删 
除 这 些 信息 ， 对 两 个 a .out 文件 执行 这 条 命令 ， 它 们 的 大 小 减 为 798760 和 6200 FH. 
没有 使 用 共享 库 时 ， 可 执行 文件 的 大 部 分 都 被 标准 VO 库 所 占用 。 

这 段 代码 不 正确 。 因 为 在 自动 变量 val 已 经 不 存在 之 后 ， 代 码 还 通过 指针 引用 这 个 已 经 不 
存在 的 自动 变量 。 自 动 变量 val 在 复合 语 名 开始 的 左 花 括 号 之 后 声明 了 ， 但 当 该 复合 语句 
结束 时 ， 即 在 匹配 的 右 花 括 号 之 后 ， 自 动 变量 就 不 存在 了 。 
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8.1 


为 了 仿真 子 进程 终止 时 关闭 标准 输出 的 行为 ， 在 调用 exit 之 前 加 下 列 代码 行 : 
fclose(stdout); 
为 了 观察 其 效果 ， 用 下 面 几 行 代 替 程 序 中 调用 printf 的 语句 。 


i = printf("pid = tld, glob = $d, var = $dMn", 
(long)getpid(), glob, var): 

sprintf(buf, "$&dMn", i); 

write(STDOUT FILENO, buf, strlen(buf)); 
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还 需要 定义 变量 i 和 buf。 

这 里 假设 子 进程 调用 exit 时 关闭 标准 IO 流 ， 但 不 关闭 文件 描述 符 STDOUT_FILENO。 有 些 

版 本 的 标准 IO 库 会 关闭 与 标准 输出 相关 联 的 文件 描述 符 从 而 引起 write 标准 输出 失败 。 在 这 

种 情况 下 ， 调 用 dup 将 标准 输出 复制 到 男 一 个 描述 符 ，write 则 使 用 新 复制 的 文件 描述 符 。 
8.2 ”可 以 通过 图 C-8 程序 来 说 明 这 个 问题 。 


#include "apue.h" 
static void fl(void), f2(void); 


int 
main(void) 
{ 
£1(); 
t£2(); 
_exit (0); 
} 


static void 
f1 (void) 
{ 
pid_t pid; 


if ((pid = vfork()) < 0) 
err_sys("vfork error"); 
/* child and parent both return */ 
} 


static void 


f2(void) 

{ 
char buf [1000]; /* automatic variables */ 
int i; 


for {i = 0; i < sizeof(buf); i++) 
buf(i] = 0; 


C-8 错误 使 用 vfork 的 例子 
"ARR £1 调用 vfork 时 ， 父 进程 的 栈 指针 指向 £1 函数 的 栈 帧 ， 见 图 C-9。vfork 使 得 子 
进程 先 执行 然后 从 fl 返回 , 接着 子 进程 调用 f2, 并 且 r2 的 栈 帧 覆盖 了 r1 的 栈 帧 ,在 £2 
中 子 进程 将 自动 变量 buf 的 值 置 为 0， 即 将 栈 中 的 1 000 个 字 节 的 值 都 置 为 0。 从 f2 返回 


后 子 进程 调用 _exit， 这 时 栈 中 main 栈 帧 以 下 的 内 容 已 经 被 £2 修改 了 。 然 后 ， 父 进程 从 


vfork 调用 后 恢复 继续 ,并 从 £1 返回 。 返 回信 息 虽 然 常常 保存 在 栈 中 , 但 是 多 半 可 能 已 经 
被 子 进程 修改 了 。 对 于 这 个 例子 ， 父 进程 恢复 继续 执行 的 结果 要 依 束 于 你 所 使 用 的 UNIX 
系统 的 实现 特征 〈 如 返回 信息 保存 在 栈 帧 中 的 具体 位 置 、 修 改动 态 变量 时 覆盖 了 哪些 信息 
等 )。 通 常 的 结果 是 一 个 core 文件 ， 但 在 你 的 系统 中 ， 产 生 的 结果 可 能 不 同 。 

84 ”在 图 8-13 中 , 我 们 先 让 父 进程 输出 , 但 是 当 父 进程 输出 完毕 子 进程 要 输出 时 ， 要 让 父 进程 终止 。 
是 父 进程 先 终止 还 是 子 进程 先 执行 输出 ， 要 依赖 于 内 核对 两 个 进程 的 调度 〈 男 一 个 竞争 条 件 )。 
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在 父 进程 终止 后 ，shell 会 开始 执行 下 一 个 程序 ， 它 也 许 会 干扰 子 进程 的 输出 。 为 了 避免 这 种 情 
况 ， 要 在 子 进程 完成 输出 后 才 终止 父 进程 。 用 下 面 的 语句 替换 程序 中 fork 后 面 的 代码 。 


else if (pid == 0) ( 
WAIT PARENT (); /* parent goes first */ 
charatatime ("output from child\n"); 
TELL PARENT (getppid()); /* tell parent we're done */ 


) else ( 
charatatime ("output from parent\n"); 
TELL CHILD (pid); /* tell child we're done */ 
WAIT CHILD(); /* wait for child to finish */ 


栈 的 底部 





Wren | 


C-9 调用 vfork HB 
由 于 只 有 终止 父 进程 才能 开始 下 一 个 程序 ， 而 该 程序 让 子 进程 先 运 行 ， 所 以 不 会 出 现 上 面 
的 情况 。 
85 对 argv[21 打 印 的 是 相同 的 值 (/home/sar/bin/testinterp)。 原 因 是 execlp 在 结 
束 时 调用 了 execve， 并 且 与 直接 调用 execl 的 路 径 名 相同 。 问 忆 图 8-15. 
8.6 C-10 程序 创建 了 一 个 伪 死 进程 。 


#include "apue.h" 





#ifdef SOLARIS 


#define PSCMD "ps -a -o pid,ppid,s,tty,comm" 
#telse 

#define PSCMD "ps -o pid, ppid, state, tty, command” 
#endif 

int 


main (void) 
{ 
pid_t pid; 


if ((pid = fork()) < 0) 
err sys("fork error"); 

else if (pid -- 0) /* child */ 
exit(0); 


/* parent */ 
sleep(4); 
system (PSCMD) ; 


exit (0); 





C-10 创建 一 个 僵 死 进程 并 用 ps 查看 其 状态 
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9.1 


10.4 
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执行 程序 结果 如 下 (ps(1) 用 z 表示 伪 死 进程 ): 


$ ./a.out 


PID 
2369 
7230 
7231 
7232 
7233 


PPID S TT 

2208 S pts/2 
2369 S pts/2 
7230 Z pts/2 
7230 S pts/2 
7232 R pts/2 


COMMAND 

-bash 

./a.out 

[a.out] <defunct> 

sh -c ps -o pid,ppid, state, tty, command 
ps -o pid,ppid,state,tty, command 


因为 init 是 登录 shell 的 父 进程 , 当 登 录 shell 终止 时 它 收 到 SIGCHLD 信号 量 , 所 以 init 
进程 知道 什么 时 候 终 端 用 户 注销 。 

网 络 登录 没有 包含 init. 在 utmp 和 wtmp 文件 中 的 登录 项 和 相应 的 注销 项 是 由 一 个 处 理 
登录 并 检测 注销 的 进程 写 的 〈 本 例 中 为 telnetd)。 


第 10 & 


10.1 当 程 序 第 一 次 接收 到 发 送 给 它 的 信号 时 就 终止 了 。 因 为 一 捕捉 到 信和 号，pause 函数 就 返回 。 
10.2 栈 帧 见 图 C-11。 


栈 的 底部 | 
main 
Mr 


| 


处 理 处 理 longjmp 
SIGINT SIGALRM 后 


main 

THU 
sleep2 
的 栈 帧 


sig_int 


TEMO 


sig alrm 


BRR 





图 C-11 longjmp 前 后 的 栈 帧 


在 sig alrm 中 通过 longjmp 返回 sleep2， 有 效 地 避免 了 继续 执行 sig_int。 从 这 一 
点 ，sleep2 返回 main【〔 回 忆 图 10-8). 

在 第 一 次 调用 alarm 和 setjmp 之 间 又 有 一 次 竞争 条 件 。 如 果 进 程 在 调用 alarm 和 
setjmp ZARA YS, MPN MMAR Af Skee. RIVA longjmp. 
但 是 由 于 没有 调用 过 setjmp， 所 以 没有 设置 env_alrnm BAK. WER longjmp 的 跳 转 缓 
冲 区 没有 被 setjmp 初始 化 ， 则 说 明 longjmp 的 操作 是 未 定义 的 。 

参见 Don Libes 的 论文 “Implementing Software Timers" (C users Journal, Vol. 8, no. 11, Nov. 
1990) 中 的 例子 。 可 以 访问 http:// www.kohala.com/start/ libes.timers.txt 


获得 该 论文 的 电子 版 。 
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10.7 如 果 仅 仅 调用 _exit， 则 进程 终止 状态 不 能 表示 该 进程 是 由 于 SIGABRT 信号 而 终止 的 。 

10.8 如 果 信 和 号 是 由 其 他 用 户 的 进程 发 出 的 ,进程 必须 设置 用 户 ID 为 根 或 者 是 接收 进程 的 所 有 者 ， 
否则 k111 不 能 执行 。 所 以 实际 用 户 ID 为 信号 的 接收 者 提供 了 更 多 的 信息 。 

10.10 对 于 本 书 作 者 所 用 的 一 个 系统 ,每 60~90 分 钟 增加 一 秒 ， 这 个 误差 是 因为 每 次 调用 sleep 
都 要 调度 一 次 将 来 的 时 间 事 件 , 但 是 由 于 CPU 调度 , 有 时 并 没有 在 事件 发 生 时 立即 被 唤醒 。 
另外 一 个 原因 是 进程 开始 运行 和 再 次 调用 sleep 都 需要 一 定量 的 时 间 。 
cron 守护 进程 这 样 的 程序 每 分 钟 都 要 获取 当前 时 间 ， 它 首先 设置 一 个 休眠 局 期 ， 然 后 在 下 
一 分 钟 开 始 时 唤醒 。( 将 当前 时 间 转 换 成 本 地 时 间 并 查看 tm sec fH.) 每 一 分 钟 ， 设 置 下 
一 个 休眠 周期 ， 使 得 在 下 一 分 钟 开始 时 可 以 唤醒 。 大 多 数 调 用 是 sleep (60) ， 偶 尔 有 一 个 
sleep(59) 用 于 在 下 一 分 钟 同 步 。 但 是 ， 车 在 进程 中 花费 了 许多 时 间 执 行 命令 或 者 系统 的 
负载 重 、 调 度 慢 ， 这 时 休眠 值 可 能 远 小 于 60. 

10.11 在 Linux 3.2.0, Mac OS X 10.6.8 和 Solaris 10 中 ， 从 来 没有 调用 过 SIGXES2 的 信号 处 理 程 
E., 一 旦 文件 的 大 小 达到 1024 时 ，write 就 返回 24. 

在 FreeBSD 8.0 中 ， 当 文件 大 小 已 达到 1000 字 节 ， 在 下 一 次 准备 写 100 字 节 时 调用 该 信号 
处 理 程序 ，write 返回 一 1， 并 且 将 errno 设置 为 EFBIG (文件 太 大 )。 
在 所 有 4 种 平台 上 ， 如 果 在 当前 文件 偏 移 量 处 〈 文 件 尾 端 ) 尝试 再 一 次 write, HMB 
SIGXFSZ 信号 ，write 将 失败 ， 返 回 -1， 并 将 errno 设置 为 EFBIG。 

10.12 结果 依赖 于 标准 VO 库 的 实现 ，fwrite 函数 如 何 处 理 一 个 被 中 断 的 write. 
例如 ， 在 Linux 3.2.0 上 ， 当 使 用 fwrite 函数 写 一 个 大 的 缓冲 区 时 ，fwrite 以 相同 的 字 
节 数 直接 调用 write. 在 write 系统 调用 当中 ， 痣 钟 时 间 到 ， 但 我 们 直到 写 结束 才 看 到 信 
号 。 看 上 去 就 好 像 在 write 系统 调用 进行 当中 内 核 阻 塞 了 信和 号 。 

与 此 不 同 的 是 ， 在 Solaris 10 中 ，fwrite 函数 调用 以 8 KB 的 增 量 调 用 write, HESS 
整个 要 求 的 字 节 数 。 当 闪 钟 时 间 到 ， 会 被 捕 提 到， 中断 write AB fwrite。 当 从 信号 处 
理 程 序 返回 时 ， 返 回 到 fwrite 函数 内 部 的 循环 ， 并 继续 以 S KB 的 增 量 写 。 
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Hl 图 C-12 给 出 了 一 个 没有 使 用 自动 变量 ， 而 采用 动态 内 存 分 配 的 程序 。 


#include "apue.h" 
#include <pthread.h> 


struct foo { 
int a, b, C, d; 


void 
printfoo(const char *s, const struct foo *fp) 
{ 
fputs(s, stdout); 
printf(" structure at Ox$1xMn", (unsigned long) fp); 
printf(" foo.a = %d\n", fp-»a); 
printf(" foo.b = d\n", fp->b); 
printf(" foo.c = d\n", fp-»c); 
printf(" foo.d = &dWMn", fp->d); 
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void * 


thr. 


{ 


} 


int 


fnl (void *arg) 
struct foo *fp; 


if ((fp = malloc(sizeof(struct foo))) == NULL) 
err sys("can't allocate memory"); 

fp-»a - 1; 

fp->b = 2; 

fp->c = 3; 

fp->d = 4; 

printfoo({"thread:\n", fp); 

return{ (void *)fp); 


main (void) 


{ 


11.2 


11.3 


11.4 


int err; 
pthread_t tidl; 
struct foo *fp; 


err - pthread create(&tidl, NULL, thr fnl, NULL); 
if (err != 0) 

err exit(err, "can't create thread 1"); 
err = pthread_join(tidl, (void *)&fp): 
if (err != 0) 

err exit(err, "can't join with thread 1"); 
printfoo("parent:\n", fp); 


exit (0); 
图 C-12 ”线程 返回 值 的 正确 使 用 
要 改变 挂 起 作业 的 线程 ID, DARA SRA THRESH. 防止 ID 在 改变 过 程 中 有 其 他 线程 


在 搜索 该 列表 。 目 前 定义 该 接口 的 方式 存在 的 问题 在 于 : 调用 job find 找到 该 作业 以 及 
调用 job remove 从 列表 中 删除 该 作业 这 两 个 时 间 之 间作 业 ID 可 以 改动 ,这 个 问题 可 以 通 
过 在 job 结构 中 嵌入 引用 计数 和 互 斥 量 ， 然 后 让 job_find 增加 引用 计数 的 方法 来 解决 。 
这 样 修改 ID 的 代码 就 可 以 避免 对 列表 中 非 零 引用 计数 的 任何 作业 进行 D 改动 的 情况 。 
首先 ， 列 表 是 由 读 写 锁 保护 的 ， 但 条 件 变 量 需 要 互 斥 量 对 条 件 进行 保护 。 其 次 ， 每 个 线程 
等 待 满足 的 条 件 应 该 是 有 某 个 作业 进行 处 理 时 需要 的 条 件 ， 所 以 需要 创建 每 线程 数据 结构 
来 表示 这 个 条 件 。 或 者 ， 可 以 把 互 斥 量 和 条 件 变量 典 入 到 queue 结构 中 ， 但 这 意味 着 所 有 
的 工作 线程 将 等 待 相 同 的 条 件 。 如 果 有 很 多 工作 线程 存在 ， 当 唤醒 了 许多 线程 但 又 没有 工 
作 可 做 时 ， 就 可 能 出 现 惊 群 效应 问题 ， 最 后 导致 CPU 资源 的 浪费 ， 并 且 增 加 了 锁 的 争夺 。 
这 根据 具体 情况 而 定 。 总 的 来 说 ， 两 种 情况 都 可 能 是 正确 的 ， 但 每 一 种 方法 都 有 不 足 之 处 。 
在 第 一 种 情况 下 ， 等 待 线程 会 被 安排 在 调用 pthread_cond_broadcast 之 后 运行 。 如 果 
程序 运行 在 多 处 理 器 上， 由 于 还 持 有 互 斥 锁 (pthread cond wait 返回 持 有 的 互 斥 锁 )， 
一 些 线程 就 会 运行 而 且 马 上 阻塞 。 在 第 二 种 情况 下 ， 运 行 线程 可 以 在 第 3 步 和 第 4 步 之 间 
TRACT FRE, 然后 使 条 件 失 效 , 最 后 释放 互 斥 锁 。 接 着 , 当 调 用 pthread cond broadcast 
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时 ， 条 件 不 再 为 真 ， 线 程 无 需 运 行 。 这 就 是 为 什么 唤醒 线程 必须 重新 检查 条 件 ， 不 能 仅仅 
因为 pthread, cond wait 返回 就 假定 条 件 就 为 真 。 
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12.1 


12.3 


12.4 


12.5 
12.6 


就 像 人 们 首先 会 猜 到 的 , 这 并 不 是 一 个 多 线程 问题 。 这 些 标 准 LO 例 程 事实 上 是 线程 安全 的 。 
我 们 调用 fork 时 ， 每 个 进程 获得 了 标准 IO 数据 结构 的 一 份 副本 。 程 序 运行 时 把 标准 输出 定 
向 到 终端 时 ， 输 出 是 行 缓冲 的 ， 所 以 每 次 打印 一 行 时 ， 标 准 VO 库 就 把 该 行 写 到 终端 上 。 但是， 
如 果 把 标准 输出 重 定向 到 文件 的 话 ， 则 标准 输出 就 是 全 缓冲 的 。 当 缓冲 区 满 或 者 进程 关闭 流 时 ， 
输出 才 会 写 到 文件 。 在 这 个 例子 中 ， 执 行 fork 时 ， 缓 冲 区 中 包含 了 还 未 写 的 几 个 打印 行 ， 所 
以 当 父 进程 和 子 进程 最 终 剖 洗 缓冲 区 中 的 副本 时 ， 最 初 的 复制 内 容 就 会 写 入 文件 。 
理论 上 来 讲 ， 如 果 在 信和 号 处 理 程 序 运 行 时 阻塞 所 有 的 信号 ， 那 么 就 能 使 函数 成 为 异步 信号 
安全 的 。 问 题 是 我 们 并 不 能 知道 调用 的 某 个 函数 可 能 并 没有 屏蔽 已 经 被 阻塞 的 信和 号， 这样 
通过 另 一 个 信号 处 理 程序 可 能 会 使 该 函数 变 成 可 重 入 的 。 

在 FreeBSD 8.0 上 ， 程 序 抛 出 core. H gdb 的 话 ， 可 以 看 到 程序 初始 化 过 程 将 调用 线程 函数 ， 这 
些 函数 调用 getenv 找到 环境 变量 LIBPTHREAD SPINLOOPS 和 LIBPTHREAD YIELDLOOPS 
的 值 。 然 而 ， 我 们 的 线程 安全 版 本 的 getenv 回调 pthread 库 函 数 会 处 于 一 种 中 间 的 不 一 致 状 
态 。 另 外 ， 线 程 初始 化 函数 会 调用 malloc, JffE malloc 中 调用 getenv 来 查找 环境 变量 
MALLOC_OPTIONS 的 值 。 

为 了 避 开 这 个 问题 ， 我 们 可 以 合理 假定 程序 启动 是 单线 程 的 ， 并 使 用 一 个 标志 来 指示 线程 初 
始 化 已 经 通过 我 们 的 getenv 来 完成 了 。 但 这 个 标志 为 假 时 ， 我 们 版 本 的 getenv 会 和 不 可 
重 入 版 本 一 样 操作 《并 且 和 避免 调用 任何 pthread 函数 和 malloc)。 然 后 我 们 提供 一 个 独立 
的 初始 化 函数 来 调用 pthread_once， 而 非 从 getenv 里 面 来 调用 它 。 这 就 要 求 在 调用 
getenv 之 前 程序 调用 我 们 的 初始 化 函数 。 这 就 解决 了 我 们 的 问题 ， 因 为 只 有 程序 启动 初始 化 
完成 后 才能 进行 。 当 程序 调用 了 我 们 的 初始 化 函数 后 ， 这 个 版 本 的 getenv 就 是 线程 安全 的 。 
如 果 希 望 在 一 个 程序 中 运行 另 一 个 程序 ， 还 需要 fork ( 即 在 调用 exec 之 前 )。 

C-13 给 出 了 使 用 select 实现 线程 安全 的 sleep 函数 ， 延 迟 一 定数 量 的 时 间 。 它 是 线程 安 
全 的 ， 因 为 它 并 不 使 用 任何 未 经 保护 的 全 局 或 静态 数据 ， 并 且 只 调用 其 他 线程 安全 的 函数 。 


#include <unistd.h> 
#include <time.h> 
#include <sys/select.h> 


unsigned 
sleep(unsigned seconds) 


{ 


int n; 

unsigned slept; 
time t start, end; 
struct timeval tv; 


tv.tv sec - seconds; 

tv.tv usec - 0; 

time(&start); 

n = select(0, NULL, NULL, NULL, &tv); 
if (n == 0) 
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return(0); 

time (&end); 

slept = end - start; 

if (slept >= seconds) 
return(0); 

return (seconds - slept); 


图 C-13 sleep 的 线程 安全 实现 


12.7 很 多 时 候 条 件 变 量 的 实现 都 使 用 互 斥 锁 来 保护 它 的 内 部 结构 。 由 于 这 是 实现 细节 ， 因 而 通 


常 是 被 隐藏 起 来 的 , 所 以 在 fork 处 理 程 序 中 没有 可 移植 的 方法 获取 或 释放 锁 。 既 然 在 调用 
fork 后 并 不 能 确定 条 件 变量 中 的 内 部 锁 状 态 ， 所 以 在 子 进 程 中 使 用 条 件 变量 是 不 安全 的 。 
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13.1 如 果 进 程 调用 chroot, 它 就 不 能 打开 /dev/Loeg。 解 决 的 办 法 是 , 守护 进程 在 调用 chroot 


之 前 调用 选项 为 LOG_NDELAY 的 openlog。 它 打开 特殊 设备 文件 (UNIX 域 数据 报 套 接 字 ) 
并 生成 一 个 描述 符 ， 即 使 调用 了 chroot 之 后 ， 该 描述 符 仍 然 是 有 效 的 。 这 种 场景 在 诸如 
ftpd (文件 传输 协议 守护 进程 )》 这 样 的 守护 进程 中 出 现 ， 为 了 安全 起 见 ， 专 门 调用 了 
chroot， 但 仍 需 要 调用 syslog 来 对 出 错 条 件 记录 日 志 。 


13.4 C-14 展示 了 一 种 解决 方案 。 


#include "apue.h" 


int 


main(void) 


{ 


FILE *fp; 
char *p; 


daemonize ("getlog"); 
p = getlogin(); 
fp = fopen("/tmp/getiog.out", "w"); 
if (fp != NULL) { 
if (p == NULL) 
fprintf(fp, "no login name\n"); 
else 
fprintf(fp, "login name: %s\n", p); 
} 
exit (0); 


C-14 调用 daemonize 然后 获得 登录 名 
其 结果 依赖 于 不 同 的 系统 实现 。 daemonize 关闭 所 有 打开 文件 描述 符 , 然后 向 /dev/null 
再 打开 前 3 个 。 这 意味 着 进程 不 再 有 控制 终端 ， 所 以 getlogin 不 能 在 utmp 文件 中 看 到 
进程 的 登录 项 。 于 是 在 Linux 3.2.0 和 Solaris 10 中 ， 我 们 发 现 守护 进程 没有 登录 名 。 
但 是 在 FreeBSD 8.0 和 Mac OS X 10.6.8 中 ， 登 录 名 是 由 进程 表 维护 的 ， 并 且 在 执行 fork 
时 复制 。 也 就 是 说 ， 除 非 其 父 进程 没有 登录 名 《〈 如 系统 自 引导 时 调用 init) AWA 
能 获得 其 登录 名 。 
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$14 


14.1 测试 程序 如 图 C-15 所 示 。 


#include "apue.h" 
#include <fcntl.h> 
#include <errno.h> 


void 

sigint (int signo) 
{ 

) 


int 

main (void) 

i 
pid t pidl, pid2, pid3; 
int fd; 


setbuf(stdout, NULL); 
signal intr(SIGINT, sigint); 


/* 

* Create a file. 

*/ 

if ((fd = open("lockfile", O RDWR|O CREAT, 0666)) < 0) 
err sys("can't open/create lockfile"); 


/* 
* Read-lock the file. 
*/ 
if ((pidl = fork()) < O) | 
err SyS("fork failed"); 
} else if (pidl == 0) { /* child */ 
if (lock reg(fd, F SETLK, F RDLCK, 0, SEEK SET, 0) < 0} 
err sys("child 1: can't read-lock file"); 
printf ("child 1: obtained read lock on file\n"); 


pause (}; 
printf ("child 1: exit after pause\n"); 
exit (0); 
} else { /* parent */ 
sleep (2); 
} 
/* 
* Parent continues ... read-lock the file again. 
*/ 


if ((pid2 = fork()) < 0} I 
err sys("fork failed"); 
) else if (pid2 == 0) { /* child */ 
if (lock reg(fd, F SETLK, F RDLCK, 0, SEEK SET, 0) < 0) 
err sys("child 2: can't read-lock file"); 
printf("child 2: obtained read lock on file\n"); 
pause(): 
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printf ("child 2: exit after pause\n"); 
exit(0); 

) else ( /* parent */ 
sleep(2); 


/* 
* Parent continues ... block while trying to write-lock 
* the file. 
*/ 
if ((pid3 = fork()) < 0) { 
err Sys("fork failed"); 
) else if (pid3 == 0) { /* child */ 
if (lock reg(fd, F SETLK, F WRLCK, 0, SEEK SET, 0) < 0) 
printf ("child 3: can't set write lock: %s\n", 
strerror(errno)); 
printf("child 3 about to block in write-lock...Mn"); 
if (lock reg(fd, F SETLKW, F WRLCK, 0, SEEK SET, 0) < 0) 
err Sys("child 3: can't write-lock file"); 
printf("child 3 returned and got write lock????\n"); 
pause(); 
printf("child 3: exit after pauseWMn"); 
exit (0); 
) else { /* parent */ 
sleep(2); 


/* 
* See if a pending write lock will block the next 
* read-lock attempt. 
wy 
if (lock reg(fd, F SETLK, F RDLCK, 0, SEEK SET, 0) < 0) 
printf("parent: can't set read lock: %s\n", 
strerror(errno)); 
else 
printf("parent: obtained additional read lock while" 
" write lock is pending Wn"); 
printf("killing child 1...\n"); 
kill(pidl, SIGINT); 
printf("killing child 2...\n"); 
kill(pid2, SIGINT); 
printf("killing child 3...\n"); 
kill(pid3, SIGINT); 
exit (0); 


图 C-15 ”判断 记录 锁 的 行为 
在 FreeBSD 8.0. Linux 3.2.0 和 Mac OS X 10.6.8 上 , 记录 锁 的 行为 是 相同 的 ， 后 增加 的 读者 
可 使 未 决 的 写 者 不 断 等 待 。 运 行 该 程序 得 到 


child 1: obtained read lock on file 

child 2: obtained read lock on file 

child 3: can't set write lock: Resource temporarily unavailable 
child 3 about to block in write-lock... 

parent: obtained additional read lock while write lock is pending 
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14.2 


14.3 


14.4 


14.5 


killing child 1... 

child 1: exit after pause 

killing child 2... 

child 2: exit after pause 

killing child 3... 

child 3: can't write-lock file: interrupted system call 


大 多 数 系 统 将 数据 类 型 £a sec 定义 为 只 包含 一 个 成 员 的 结构 ， 该 成 员 为 一 个 长 整 型 数组 。 
数组 中 每 一 位 bit) 对 应 于 一 个 描述 符 。4 个 FD_ 宏 通过 开 、 关 或 测试 指定 的 位 对 这 个 数组 
进行 操作 。 

将 之 定义 为 一 个 包含 数组 的 结构 而 不 仅仅 是 一 个 数组 的 原因 是 ; 通过 C 语言 的 赋值 语句 ， 
可 以 使 £d set 类 型 的 变量 相互 赋值 。 

大 多 数 系统 允许 用 户 在 包括 头 文件 <sys/select .h> 前 定义 常量 FD_sETSIZE。 例 如 ， 我 
们 可 以 写 下 面 这 样 的 代码 来 定义 £d set 数据 类 型 ， 使 其 可 以 包含 2 048 个 描述 符 : 


#define FD SETSIZE 2048 
#include <sys/select.h> 


遗憾 的 是 ， 事 情 并 非 如 此 简单 。 为 了 在 现代 系统 使 用 该 技术 ， 我 们 需要 做 以 下 几 件 事情 。 
(OD 在 包含 任何 头 文件 之 前 ， 我 们 需要 定义 哪 种 符号 来 防止 包含 <sys/select.h>。 
一 些 系统 会 使 用 一 个 单独 的 符号 来 保护 £d sec 类 型 的 定义 ， 我 们 也 需要 如 此 定义 。 
例如 , 在 FreeBSD 8.0 中 , 我 们 需要 定义 SYS_SELECT H 来 防止 包含 <sys/select .h>， 
定义 _FD_SET 来 防止 包含 fad set 数据 类 型 的 定义 。 
(2) 有 了 时， 为 了 和 和 旧 应 用 程序 兼容 ，<sys/types.h> 定 义 了 fd set 的 大 小 ， 所 以 我 们 
必须 首先 包含 它 ， 然 后 去 掉 FD_SETSIZE 的 定义 。 注 意 ， 一 些 系统 用 _FD_SETSIZE 来 代替 。 
(3) 想 能 够 使 用 select 时 ， 我 们 需要 重新 定义 FD SETSIZE (HR FD SETSIZE) 
来 最 大 化 文件 描述 符 的 数量 。 
(4) 我 们 需要 取消 定义 第 一 步 定 义 的 符号 。 
(5) 最 终 ， 我 们 能 够 包含 <sys/select.h>。 
在 运行 程序 之 前 ， 我 们 需要 配置 系统 允许 我 们 打开 所 需 的 文件 描述 符 数量 ， 这 样 我 们 能 够 
实际 利用 的 文件 描述 符 数量 达到 FD SETSIZE T. 
下 面 列 出 了 功能 类 似 的 函数 。 
FD_ZERO sigemptyset 
FD_SET sigaddset 
FD_CLR sigdelset 





FD ISSET  Sigismember 


没有 与 sigfillset 对 应 的 FD_xxx 函数 。 对 信号 量 集 来 说 ， 指 向 信号 量 集 的 指针 总 是 第 
一 个 参数 ， 信 号 编号 是 第 二 个 参数 。 对 于 描述 符 来 说 ， 描 述 符 编号 是 第 一 个 参数 ， 指 向 描 
述 符 集 的 指针 是 第 二 个 参数 。 

利用 select 实现 的 程序 见 图 C-16。 


#include "apue.h" 
#include <sys/select.h> 


void 


sleep_us (unsigned int nusecs) 
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struct timeval tval; 


tval.tv sec = nusecs / 1000000; 
tval.tv usec = nusecs $ 1000000; 
select (0, NULL, NULL, NULL, &tval); 


— 





C-16 用 select 实现 sleep us 函数 
利用 poll 实现 的 程序 见 图 C-17. 


#include «poll.h» 





void 
sleep us(unsigned int nusecs) 
{ 
struct pollfd dummy; 
int timeout; 


if ((timeout nusecs / 1000) <= 0) 
timeout 1; 
poll(&dummy, 0, timeout); 


— 


图 C-17 FA poll 实现 sleep us 函数 


如 BSD usleep(3) 手 册页 中 所 说 明 的 ，usleep 使 用 nanosleep 函数 ， 该 函数 没有 与 调 
用 进程 设置 的 定时 器 交互 。 

14.6 不 行 。 我 们 可 以 使 TELL_WAIT 创建 一 个 临时 文件 ， 其 中 1 个 字 节 用 做 父 进程 的 锁 ， 另 外 1 
个 字 节 用 做 子 进 程 的 锁 。WRAIT_CHILD 使 得 父 进程 等 待 获 取 子 进程 字 节 上 的 锁 ， 
TELL PARENT 使 得 子 进程 释放 子 进程 字 节 上 的 锁 。 但 是 问题 在 于 ,调用 fork 会 释放 所 有 
子 进 程 中 的 锁 ， 使 得 子 进程 开始 运行 时 不 具有 任何 它 自 己 的 锁 。 

14.7 图 C-18 中 示 出 了 一 种 解决 方法 。 


#include "apue.h" 
#include <fcntl.h> 


int 

main (void) 

( 
int i, n; 
int fd[2]; 


if (pipe(fd) < 0) 
err sys("pipe error"); 
set fl(fd[1], O NONBLOCK); 


/* write 1 byte at a time until pipe is full */ 
for (n = 0; ; n**) ( 
if ((i = write(fd[1], "a", 1)) != 1) { 
printf("write ret $d, ", i); 
break; 
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printf("pipe capacity = %d\n", n); 
exit(0); 


C-18 用 非 阻塞 写 计 算 管 道 的 容量 
下 表 列 出 了 在 本 书 所 述 的 4 种 平台 上 计算 出 来 的 值 。 


FreeBSD 8.0 65 536 

Linux 3.2.0 65 536 

Mac OS X 10.6.8 16 384 

Solaris 10 16 384 
这 些 值 可 能 与 对 应 的 PIPE_BUF 值 不 同 ， 其 原因 是 ，PIPE_BUF 被 定义 为 可 被 自动 原子 地 
写 至 一 个 管道 的 最 大 数据 量 。 这 里 ， 我 们 计算 的 是 一 个 管道 独立 于 任何 原子 性 限制 可 保持 
的 数据 量 。 

14.10 图 14-27 中 的 程序 是 否 更 新 输入 文件 的 上 一 次 访问 时 间 依 束 于 操作 系统 以 及 文件 所 属 的 文 
件 系统 的 类 型 。 在 所 有 4 种 平台 中 ， 当 文件 具有 给 定 操作 系统 默认 的 文件 系统 类 型 ，. 上 一 
次 访问 时 间 就 会 更 新 。 
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15.1 如 果 管 道 的 写 端 总 是 不 关闭 ， 则 读者 就 决 不 会 看 到 文件 结束 符 。 分 页 程序 就 会 一 直 阻 塞 在 
读 标 准 输 入 。 

152 父 进程 向 管道 号 完 最 后 一 行 以 后 就 终止 ， 当 父 进程 终止 时 管道 的 读 端 自动 关闭 。 但 是 由 于 
子 进 程 〈 分 页 程序 ) 要 等 待 输出 的 页 ， 所 以 父 进 程 可 能 比 子 进 程 领先 一 个 管道 缓冲 区 。 如 
果 正 在 运行 的 是 一 个 可 对 命令 行进 行 编辑 的 交互 式 shell, W Kom shell， 那 么 当 父 进程 终止 
时 ，shell 多 半 会 改变 终端 的 模式 并 打印 一 个 提示 。 这 个 无 疑 会 影响 已 经 对 终端 模式 进行 修 
改 的 分 页 程序 (由 于 大 部 分 分 页 程序 在 等 待 处 理 下 一 个 页 面 时 将 终端 置 为 非 正规 模式 )。 

15.3 因为 执行 了 shell， 所 以 popen 返回 一 个 文件 指针 。 但 是 shell 不 能 执行 不 存在 的 命令 ， 因 
此 在 标准 错误 上 打印 下 面 信息 后 终止 ; 


sh: line 1: ./a.out: No such file or directory 


其 退出 状态 为 127〈 该 值 取决 于 shell HAH). pclose 返回 该 命令 的 终止 状态 ， 这 如 同 从 
waitpid 返回 一 样 。 

15.4 当 父 进程 终止 时 ,用 shell 看 它 的 终止 状态 .对 于 Bourne shell, Bourne-again shell 和 Korn shell, 
所 用 的 命令 是 echo $?， 打 印 的 结果 是 128 加 信号 编号 。 

15.5 首先 加 入 下 面 的 声明 : 


FILE *fpin, *fpout; 


然后 用 fdopen 关联 管道 描述 符 和 标准 VO 流 , 并 将 流 设 置 为 行 缓冲 的 。 在 从 标准 输入 读 的 
while 循环 之 前 做 此 工作 。 









if ((fpin = fdopen(fd2[0], "r")) == NULL) 
err sys("fdopen error"); 
if ((fpout = fdopen(fd1[1], "w")) == NULL) 


err sys("fdopen error"); 
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if (setvbuf(fpin, NULL,  IOLBF, 0) < 0) 
err sys("setvbuf error"); 

if (setvbuf(fpout, NULL, _IOLBF, 0) < 0) 
err sys("setvbuf error"); 


while 循环 中 的 write 和 read 用 下 面 的 语句 代替 : 


if (fputs(line, fpout) == EOF) 
err sys("fputs error to pipe"); 

if (fgets(line, MAXLINE, fpin) == NULL) 1 
err msg("child closed pipe"); 
break; 

) 


15.6 system 函数 调用 了 wait: 终止 的 第 一 个 子 进程 是 由 popen 产生 的 。 因 为 该 子 进程 不 是 
system 创建 的 ， 所 以 它 将 再 次 调用 wait 并 一 直 阻 塞 到 sleep 完成 。 然 后 system 返 
回 。 当 pclose 调用 wait 时 ， 由 于 没有 子 进程 可 等 待 所 以 返回 出 错 ， 导 致 pclose 也 返 
回 出 错 。 

15.7 尽管 具体 细节 会 随 平台 不 同 而 不 同 〈《 见 图 C-19), 但 是 select 表明 描述 符 是 可 读 的 。 调 用 
read 读 完 所 有 的 数据 后 ， 返 回 0 就 表明 到 达 了 文件 尾 端 。 但 是 对 于 poll Kiki, AKA 
POLLHUP 事件 ， 则 表明 也 许 仍 有 数据 可 读 。 但 是 一 旦 读 完 了 所 有 的 数据 ，read 就 返回 0 
表明 到 达 了 文件 尾 端 。 在 读 完 了 所 有 的 数据 后 ，POLLIN 事件 就 不 会 再 返回 了 ， 即 使 需要 再 
调用 一 次 read 以 接收 文件 尾 端 通知 〈 返 回 值 为 0)。 


NECEM... Linux 3.2.0 | Mac OS X 10.6.8 | Solaris 10 


管道 写 端 关闭 时 读 端 上 的 select | select 
管道 写 端 关 闭 时 读 端 上 的 poll 
管道 读 端 关闭 时 写 端 上 的 select 
管道 读 端 关闭 时 写 端 上 的 poll 


图 C-19 select Ml poll 的 管道 行为 

图 C-19 PRA R CAH). W (可 写 )、E CHR). HUP GEW), ERR (错误 ) 
和 INV (无 效 文件 描述 符 )。 对 于 引用 已 被 读者 关闭 的 管道 的 输出 描述 符 来 说 ，select # 
明 该 描述 符 是 可 写 的 。 但 当 我 们 调用 write 时 ， 产 生 SIGPIPE 信号 。 如 果 忽 略 该 信号 或 
从 其 信号 处 理 程序 中 返回 ，write 就 会 失败 ， 将 error 设置 成 EPIPE。 而 对 于 poll, A 
体 的 行为 则 会 根据 平台 的 不 同 而 不 同 。 

15.8 子 进程 向 标准 错误 写 的 内 容 同 样 也 会 在 父 进 程 的 标准 错误 中 出 现 。 只 要 在 cmdstring 中 包含 
shell 重 定向 2>&1， 就 可 以 将 标准 错误 发 回 给 父 进程 。 

15.9 popen 函数 fork 一 个 子 进程 ， 子 进程 执行 shell。 然 后 shell 再 调用 fork， 最 后 由 shell 的 
子 进程 执行 命令 串 。 当 cmdstring 终止 时 ，shell 恰好 在 等 待 该 事件 。 然 后 shell 退出 ， 而 这 
一 事件 又 是 pclose 中 的 waitpid 所 等 待 的 。 

15.10 解决 的 办 法 是 打开 〈open) FFO 两 次 : 一 次 读 ， 一 次 号 。 我 们 决 不 会 使 用 为 写 而 打开 的 描 
RT, 但 是 使 该 描述 符 打 开 就 可 在 客户 数 从 1 变 为 0 时， 阻止 产生 文件 尾 端 。 打 开 FIFO 两 
次 需要 注意 下 列 操作 方式 〈 如 非 阻塞 open 所 要 求 的 ); 第 一 次 以 非 阻 塞 、 只 读 方 式 open: 
第 二 次 以 阻塞 、 只 写 方式 open。( 如 果 先 用 非 阻塞 、 只 写 方式 open， 将 返回 错误 。〉 然 后 
关闭 读 描述 符 的 非 阻塞 属性 。 参 见 图 C-20 所 示 的 代码 。 
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Kinclude "apue.h" 
Kinclude «fcntl.h» 


#define FIFO "temp. fifo" 


int 
main (void) 
{ 
int fdread, fdwrite; 


unlink (FIFO); 

if (mkfifo(FIFO, FILE_MODE) < 0) 
err_sys("mkfifo error"); 

if ((fdread = open(FIFO, O RDONLY | O NONBLOCK)) < 0) 
err sys("open error for reading"); 

if ((fdwrite = open(FIFO, O WRONLY)) « 0) 
err sys("open error for writing"); 

clr fl(fdread, O NONBLOCK); 

exit (0); 


图 C-20 ”以 非 阻 塞 方式 打开 FIFO 进行 读 、 写 操作 
15.11 随意 读 取 现行 队列 中 的 消息 会 干扰 客户 进程 -服务 器 进程 协议 ， 导 致 丢失 客户 进程 请 求 或 者 
服务 器 进程 的 响应 。 只 要 知道 队列 的 标识 符 或 者 该 队列 允许 所 有 的 用 户 读 ， 进 程 就 可 以 读 
队列 。 

15.13 由 于 服务 器 进程 和 各 客户 进程 可 能 会 将 段 连接 到 不 同 的 地 址 ， 所 以 在 共享 存储 段 中 决 不 会 
[937 存储 实际 物理 地 址 。 相 反 ， 当 在 共享 存储 段 中 建立 链表 时 ， 链 表 指 针 的 值 会 设置 为 共享 存 
储 段 内 另 一 对 象 的 偏 移 量 。 偏 移 量 为 所 指 对 象 的 实际 地 址 减 去 共享 存储 段 的 起 始 地 址 。 

15.14 图 C-21 显示 了 相关 的 事件 。 


父 进程 的 | 子 进程 的 i | 共享 值 | update 
NL 设置 成 设置 成 返回 


| 由 mmap 初 始 化 
子 进程 先 运 行 ， 然 后 被 阻塞 
父 进程 运行 


然后 父 进程 被 阻塞 
子 进程 继续 


然后 子 进程 被 阻塞 
父 进程 继续 


然后 父 进 程 被 阻塞 


然后 子 进程 被 阻塞 
父 进程 继续 


H C-21 Hl15-33 中 父 进 程 和 子 进 程 之 间 的 交替 过 程 
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第 16 xXx 
161 图 C-22 显示 了 一 个 打印 系统 字 节 序 的 程序 。 


#include <stdio.h> 
#include <stdlib.h> 
#include <inttypes.h> 


int 
main (void) 
{ 
uint32_t i = 0x04030201; 
unsigned char *cp = (unsigned char *) &i; 


if (*cp == 1) 

printf ("little-endian\n"); 
else if (*cp == 4) 

printf ("big-endian\n"); 
else 

printf ("who knows?\n"); 
exit (0); 


图 C-22 ” 判 其 系统 字 节 序 

16.3 对 于 我 们 将 要 监听 的 每 个 端点 ， 需 要 绑 定 到 一 个 合适 的 地 址 ， 并 对 应 每 个 描述 符 在 fd. set 

结构 中 写 一 条 记录 。 然 后 使 用 select 等 待 从 多 个 端点 来 的 连接 请 求 。 回 忆 16.4 节 ， 当 一 

个 连接 请 求 达 到 时 ， 一 个 被 动 的 端点 将 会 变 得 可 读 。 当 一 个 连接 请 求 真 的 到 达 时 ， 我 们 接 

受 该 请 求 ， 并 如 以 前 一 样 处 理 。 
16.5 在 main 过 程 中 ， 通 过 调用 我 们 的 signal BA (WA 10-18) 来 捕捉 SIGCHLD, RRR 

将 使 用 sigaction 来 安装 处 理 程序 指定 可 重启 的 系统 调用 选项 。 下 一 步 ， 从 serve 函数 

中 删除 waitpid 调用 。 当 fork 完 子 进程 来 处 理 请 求 后 ， 父 进程 关闭 新 的 文件 描述 符 并 继 

续 监 听 新 的 连接 请 求 。 最 后 ， 需 要 一 个 针对 于 SIGCHLD 的 信号 处 理 程序 ， 如 下 : 

i ust signo) 


{ 
while (waitpid((pid t)-1, NULL, WNOHANG) > 0) 


) 


166 为 了 允许 异步 套 接 字 UVO， 需 要 使 用 F SETOWN fcntl 命令 建立 套 接 字 所 有 权 ， 然 后 使 用 
FIOASYNC ioctl] 命令 允许 异步 信号 。 为 了 不 允许 异步 套 接 字 WO， 只 要 简单 地 禁用 异步 
信号 即 可 。 我 们 混合 使 用 fcnt1 和 ioctl 命令 的 理由 是 ， 想 找到 最 可 移植 的 方法 。 代 码 
如 图 C-23 所 示 。 


#include “apue.h" 

#include <errno.h> 

#include «fcntl.h» 

finclude <sys/socket.h> 

#include <sys/ioctl.h> 

#if defined(BSD) || defined(MACOS) || defined(SOLARIS) 
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#include <sys/filio.h> 
#endif 


int 
setasync(int sockfd) 
{ 


int n; 


if (fcntl(sockfd, F SETOWN, getpid()) < 0) 
returní-1); 

n= 1; 

if (ioctl(sockfd, FIOASYNC, &n) < 0} 
returní-1); 

return(0); 


} 


int 
clrasync(int sockfd) 
{ 


int n; 


n = 0; 

if {ioctl (sockfd, FIOASYNC, &n) < 0) 
return (-1); 

return (0); 


图 C-23 允许 与 不 允许 异步 套 接 字 VO 
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17.1 常规 管道 提供 了 一 个 字 节 流 接口 。 为 了 确定 消息 边界 ， 我 们 必须 增加 给 每 个 消息 增加 一 个 
头 部 来 指示 长 度 。 但 这 个 仍 涉及 两 个 额外 的 复制 操作 :一 个 是 写 入 至 管道 ， 另 一 个 是 从 管 
道 读 出 。 更 加 有 效 的 方法 是 仅 将 管道 用 于 告知 主线 程 有 一 个 新 消息 可 用 。 我 们 用 单个 字 节 
用 作 通 知 。 采 用 这 种 方法 ， 我 们 需要 移动 mymesg 结构 到 threadinfo 结构 ， 并 使 用 一 个 
HFE (mutex) 和 一 个 条 件 变 量 (condition variable) 来 防止 辅助 线程 在 主线 程 完成 之 前 
重新 使 用 mymesg 结构 。 解 决 方案 如 图 C-24 所 示 。 

#include "apue.h" 

#include «poll.h» 

#include <pthread.h> 


#include «sys/msg.h» 
#include <sys/socket.h> 


#define NQ 3 /* number of queues */ 
#define MAXMSZ 512 /* maximum message size */ 
#define KEY 0x123 /* key for first message queue */ 


struct mymesg { 

long mtype; 

char mtext [MAXMSZ+1]; 
}; 
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struct threadinfo { 


int qid; 
int fd; 
int len; 


pthread mutex t mutex; 
pthread cond t ready; 
struct mymesg m; 


void * 
helper(void *arg) 
{ 
int n; 
struct threadinfo *tip - arg; 


for(;;) { 
memset (&tip->m, 0, sizeof(struct mymsg)); 
if (tn = msgrev(tip->qid, &tip->m, MAXMSZ, 0, 
MSG_NOERROR)) < 0) 

err sys("msgrcv error"); 

tip->len = n; 

pthread mutex lock(&tip-»mutex); 

if (write(tip-»fd, "a", sizeof(char)) < 0) 
err sys("write error"); 

pthread cond wait(&tip-»ready, &tip-»mutex); 

pthread mutex unlock(&tip-»mutex); 


int 

main {) 

{ 
char c; 
int i, n, err; 
int fd[2]; 
int ‘qid [NQ]; 
struct pollfd pfd[NQ] ; 
struct threadinfo ti[NQ]; 
pthread t tid[NQ]; 


for (i = 0; i < NQ; i++) ( 
if ((qid[i] = msgget((KEY*i), IPC CREAT|0666)) < O) 
err sys("msgget error"); 


printf("queue ID $d is %d\n", i, gid[il); 


if (socketpair(AF UNIX, SOCK DGRAM, 0, fd) < 0) 
err sys("socketpair error"); 

pfd[i].fd = fd[0]; 

pfd[i].events = POLLIN; 

ti[i].qid = qid[i]; 

ti[i].fd = fd[1); 

if (pthread cond init(&ti[i].ready, NULL) != 0) 
err sys("pthread cond init error"); 

if (pthread mutex init(&ti[i).mutex, NULL) !- 0) 
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err sys("pthread mutex init error"); 
if ((err = pthread create(&tid[i], NULL, helper, 
&ti[i])) !- 0) 
err exit(err, "pthread create error"); 


) 


for (77) ( 
if (poll(pfd, NQ, -1) < 0} 
err sys("poll error"); 
for (i = 0; i « NQ; i++) { 
if (pfd[il.revents & POLLIN) { 
if ((n = read(pfd[i].fd, &c, sizeofí(char))) < 0) 
err sys("read error"); 
ti(i].m.mtext[ti[i].len] = 0; 
printf ("queue id $d, message %s\n", qid[i], 
ti[il.m.mtext); 
pthread mutex lock(&ti[i].mutex); 
pthread cond signal(&ti[i].ready): 
pthread mutex unlock(&ti[i].mutex); 


) 


exit(0); 


C-24 ”使 用 管道 的 XSI 消息 轮 询 
声明 指定 了 标识 符 集合 的 属性 〈 如 数据 类 型 )。 如 果 声 明 也 导致 分 配 了 存储 单元 ， 那 么 这 就 是 定义 。 
在 头 文件 opend.h 中 , 我 们 用 extern 存储 类 声明 了 3 个 全 局 变量 ， 这 时 并 没有 为 它们 分 
配 存 储 单 元 。 在 文件 main.c 中 ， 我 们 定义 了 3 个 全 局 变量 。 有 时 ， 我 们 也 会 在 定义 全 局 
变量 时 就 初始 化 它 ， 但 通常 是 使 用 C 的 默认 值 。 
select Ml poll 返回 就 绪 的 描述 符 个 数 作为 函数 值 。 当 将 这 些 就 绪 描 述 符 都 处 理 完 后 ， 操 
作 client 数组 的 循环 就 可 以 终止 。 
建议 的 解决 方案 存在 的 第 一 个 问题 是 ， 在 文件 可 能 发 生变 化 的 地 方 ， 调 用 stat 和 调用 
unlink 之 间 存 在 竞争 。 第 二 个 问题 是 , 如 果 名 字 是 一 个 指向 UNIX 域 套 接 字 文 件 的 符号 链 
接 ， 那 么 stat 会 报告 名 字 是 一 个 套 接 字 (回想 一 下 后 面 跟 一 个 符号 链接 的 stat MH, 
但 是 调用 unlink 时 ， 实 际 上 我 们 是 删除 了 这 个 符号 链接 而 不 是 套 接 字 文 件 。 为 了 解决 第 
二 个 问题 ， 应 该 使 用 lstat 而 不 是 stat， 但 这 解决 不 了 第 一 个 问题 。 
第 一 种 选择 是 将 两 个 文件 描述 符 在 一 个 控制 消息 中 的 发 送 ， 每 一 个 文件 描述 符 存 储 在 相 邻 
的 内 存 位 置 中 。 下 面 的 代码 展示 了 这 种 方法 : 


struct msghdr msg; 

struct cmsghdr *cmptr; 

int *ip; 

if ((cmptr = calloc(1, CMSG LEN(2*sizeof(int)))) -- NULL) 
err sys("calloc error"); 

msg.msg control - cmptr; 

msg.msg controllen = CMSG LEN (2*sizeof (int)); 

/* continue initializing msghdr... */ 

cmptr-»cmsg len = CMSG LEN(2*sizeof(int)); 

cmptr-»cmsg level - SOL SOCKET; 
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emptr->cmsg_type = SCM RIGHTS; 

ip = (int *)CMSG_DATA(cmptr) 

*iptt = fdl; 

*ip = fd2; 

这 种 方法 在 本 书 中 涉及 的 4 个 平台 上 全 都 可 以 工作 。 第 二 种 选择 是 将 两 个 独立 的 cmsghdr 
结构 打包 到 一 个 消息 中 。 

struct msghdr msg: 


struct cmsghdr *cmptr; 


if ((cmptr = callocí(1, 2*CMSG LEN(sizeof(int)))) == NULL) 
err sys("calloc error"); 

msg.msg control - cmptr; 

msg.msg controllen = 2*CMSG LEN(sizeof(int)): 

/* continue initializing msghdr... */ 

cmptr-»cmsg len = CMSG LEN(sizeof(int]); 

cmptr-»cmsg level = SOL, SOCKET; 

cmptr-»cmsg type = SCM RIGHTS; 

*(int *)CMSG DATA(cmptr) = fdl; 

cmptr = CMPTR NXTHDR(&msg, cmptr); 

cmptr-»cmsg len = CMSG LEN(sizeof(int)); 

cmptr-»cmsg level = SOL SOCKET; 

cmptr-»cmsg type = SCM RIGHTS; 

*(int *)CMSG DATA(cmptr) - fd2; 


与 第 一 种 方法 不 同 ， 这 个 方法 只 在 FreeBSD 8.0 上 能 工作 。 
第 18 xx 


18.1 注意 ， 由 于 终端 是 非 规范 模式 的 ， 所 以 必须 要 用 换行 符 而 不 是 回 车 符 终止 reset 命令 。 
18.2 它 为 128 个 字符 建 了 一 张 表 , 根据 用 户 的 要 求 设 置 最 高 位 (奇偶 校 验 位 )。 然 后 使 用 8 位 VO 

处 理 奇偶 位 的 产生 。 
18.3 如 果 你 使 用 的 是 窗口 终端 ， 那 么 你 无 需 登 录 两 次 。 在 两 个 分 开 的 窗口 之 间 ， 你 可 以 做 这 样 

的 实验 。 在 Solaris 中 ， 运 行 stty -a， 并 且 将 标准 输入 重 定 向 到 运行 vi 的 终端 。 结 果 显 

ZR vi 设置 MIN 为 1. TIME 为 1l. read 调用 会 一 直 等 待 ， 直 到 至 少 键入 一 个 字符 ， 但 是 

该 字符 输入 后 ， 只 对 后 继 的 字符 等 待 十 分 之 一 秒 即 返回 。 
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19.1 telnetd 和 rlogind 两 个 服务 器 均 以 超级 用 户 权限 运行 ， 所 以 它们 都 可 以 成 功 地 调用 
chown 和 chmod. 

19.2 执行 pty -n stty -a 以 避免 伪 终 端 从 设备 的 termios 结构 和 winsize 结构 初始 化 。 

19.4 BPE, fentl 的 F_SETFL 命令 不 允许 改变 读 写 状态 。 

19.5 有 3 个 进程 组 : (1) 登录 shell, (2) pty 父 进程 和 子 进程 ，(3) cat 进程 。 前 两 个 进程 组 
组 成 了 一 个 会 话 ， 其 中 ， 登 录 shell 为 会 话 首 进程 。 第 二 个 会 话 仅 包含 cat 进程 。 第 一 个 进 
GA (ES shell) 是 后 台 进 程 组 ， 其 他 两 个 进程 组 是 前 台 进 程 组 。 

19.6 首先 ， 当 cat 从 其 行规 程 模块 接收 到 文件 结束 符 时 会 终止 。 这 导致 PTY 从 设备 终止 ， 进 而 
导致 PTY 主 设备 终止 。 接 着 ， 对 于 正 从 PTY 主 设备 读 取 的 pty 父 进程 产生 一 个 文件 结束 
符 。 该 父 进程 将 SIGTERM 信号 发 送 给 子 进程 ， 于 是 子 进程 终止 。( 子 进程 不 捕 提 该 信号 。) 
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最 后 ， 父 进程 调用 main 函数 尾 端的 exit(0) 。 


8-29 所 示 程 序 的 相关 输出 为 ， 
cat e= 270, chars = 274, stat = 0: 
pty e = 262, chars = 40, stat = 15: F X 
pty e- 288, chars - 188, stat - 0: 
19.7 这 可 通过 使 用 shell 的 echo 命令 和 date(1) 命令 实现 ， 它 们 都 在 一 个 子 shell F: 
#!/bin/sh 
(echo "Script started on " ‘date’; 
pty "S(SHELL:-/bin/sh]"; 
echo "Script done on " '"date') | tee typescript 


19.8 PTY 从 设备 上 的 行规 程 能 够 回 显 , 所 以 pty 从 其 标准 输入 所 读 取 的 以 及 写 向 PTY 主 设备 的 
按 默认 都 回 显 。 尽 管 程序 (ttyname ) 从 不 读 取 数据 ， 但 是 该 回 显 也 可 通过 从 设备 上 的 行 
规程 模块 实现 。 
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20.1 db dodelete 中 保守 的 加 锁 操作 是 为 了 避免 和 db nextrec 发 生 竞争 条 件 。 如 果 没 有 使 用 
写 锁 保护 db_ writedat 调用 ， 则 有 可 能 在 do nextrec 读 某 个 记录 时 ， 该 记录 已 被 删除 : 
db nextrec 首先 读 入 一 个 索引 记录 ， 判 定 该 记录 非 空 ， 接 着 读数 据 记 录 ， 但 是 在 它 调 用 
.db readidx fll db readdat 之 间 ， 该 记录 却 可 能 被 _db_dodelete MMT. 

20.2 假定 db nextrec 亩 用 db_reaqidx， 它 将 记录 的 键 读 入 索引 缓冲 区 。 然 后 ， 该 进程 被 内 
核 调度 进程 暂停 ， 另 一 个 进程 运行 ， 它 刚好 调用 do delete 删除 了 这 一 条 记录 ， 使 得 索引 文 
件 和 数据 记录 文件 中 对 应 部 分 都 被 清空 。 当 第 一 个 进程 恢复 执行 并 调用 _db_readdat (在 
db nextrec 函数 体 中 ) 时 ， 返回 的 是 空 数据 记录 。db_nextrec 中 的 读 锁 使 得 读 入 索引 记录 
的 过 程 和 读 入 数据 记录 的 过 程 是 一 个 原子 操作 〈 对 于 其 他 操作 同一 数据 库 的 合作 进程 而 言 )。 

20.3 强制 性 锁 对 其 他 的 读 进 程 和 写 进程 产生 了 影响 。 在 _db_writeidx Wl! db writedat 设置 
的 锁 被 解除 之 前 ， 其 他 的 读 操作 和 写 操作 都 将 被 阻塞 。 

20.5 在 写 索 引 记录 之 前 写 数据 记录 ， 通 过 这 一 方法 来 防止 如 下 情形 : 若 该 进程 在 两 次 写 之 间 被 
杀 死 从 而 产生 不 正常 的 记录 。 如 果 进 程 先 写 索 引 记 录 ， 而 在 写 数据 记录 之 前 被 杀 死 ， 那 么 
就 会 得 到 一 个 有 效 的 索引 记录 ， 但 它 却 指向 一 个 无 效 的 数据 记录 。 
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21.5 这 里 有 一 些 提 示 。 有 两 个 地 方 可 以 检查 队列 中 的 作业 : 打印 守护 进程 的 队列 和 网 络 打印 机 
的 内 部 队列 。 注 意 ， 不 要 让 一 个 用 户 可 以 取消 其 他 用 户 的 打印 作业 。 当 然 ， 超 级 用 户 可 以 
取消 任何 作业 。 

21.7 不 需要 唤醒 守护 进程 ， 因 为 知道 需要 打印 一 个 文件 时 才 需 要 重读 配置 文件 。Printer_thread 
函数 在 每 次 向 打印 机 发 送 作 业 之 前 检查 是 否 需 要 重读 配置 文件 。 

21.9 需要 使 用 null 字 节 来 终止 写 到 作业 文件 的 字符 串 (strlen 在 计算 字符 串 长 度 时 不 包含 终止 
null 字 节 )。 有 两 种 简单 的 方法 ;要么 对 写 入 的 字 节 数 加 1， 要 么 使 用 dprintf 函数 而 不 是 
调用 sprintf Ñ write. 
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setservent MA, 452, 599 
函数 定义 , 599 
setsid BR, 294—295, 297, 310-311, 331, 464-467, 724, 
721—728 
函数 定义 , 295 
setsockopt PAR, 331, 624—625, 651 
函数 定义 , 624 
setspent 函数 , 182 
函数 定义 , 182 
settimeofday MR, 190 
setuid AR, 98, 256, 258, 260, 288, 331, 816 
函数 定义 , 256 
set-user-ID 《设置 用 户 ID) , 98-99, 102, 104, 107—108, 110, 
129, 140, 182, 233, 253, 256-257, 259, 267, 317, 546, 
585—586, 653, 924 
saved (REREH ID) , 56, 98, 256-260, 288, 337 
setutxent 函数 , 442, 452 
SETVAL 常量 , 568, 570 
setvbuf MA, 146—147, 150, 171, 175, 220, 552, 721, 936 
函数 定义 , 146 
SGI (Silicon Graphics, Inc.) , 35 
SGID, M set-group-ID 
SHA-1 CSHA-1 加 密 算法 》 , 181 
shadow passwords 《阴影 口令 ) , 181—182, 196, 918 
«shadow.h»3k X fF, 186 
S HANGUP 常量 , 510 
Shannon, W. A., 525, 949 
shared 
libraries 共享 库 ), 206-207, 226, 753, 920, 947 
memory 〈 共 享 内 存 ) ，534, 571-578 


sharing, file〈 文 件 共享 ) , 74~77, 231 
shell， 见 Bourne shell, Bourne-again sheli, C shell, Debian 
Almquist shell, Korn shell, TENEX C shell 
SHELL 环境 变量 , 211, 288, 737 
shell, job-contro] (作业 控制 shell) , 294, 299, 306-307, 325, 
358, 377, 379, 734—735 
shell layers (shell E) , 299 
shells, 3 
S_HIPRI 常量 , 510 
shmat 函数 , 559, 573-576 
函数 定义 ,574 
shmatt t 数据 类 型 , 572 
shmctl MR, 558, 562, 573-575 
函数 定义 , 573 
shmdt 函数 , 574 
函数 定义 , 574 
shmget MX, 557—558, 572, 575 
B XE X, 572 
shmid ds 结构 , 572-574 
SHMLBA 常量 , 574 
SHM LOCK 常量 , 573 
SHM RDONLY 常量 , 574 
SHM_RND 常量 , 574 
SHRT MAX 常量 , 37 
SHRT_MIN 常量 , 37 
shutdown MR, 331, 592—593, 612 
函数 定义 , 592 
SHUT_RD 常量 , 592 
SHUT_RDWR 常量 , 592 
SHUT WR 常量 , 592 
SI ASYNCIO 常量 , 353 
S IFBLK 常量 , 134 
S IFCHR 常量 , 134 
S_IFDIR 常量 , 134 
S IFIFO 常量 , 134 
S IFLNK 常量 , 114, 134 
S IFMT 常量 , 97 
S IFREG 常量 , 134 
S IFSOCK 常量 , 134, 634 
sig2str 函数 , 380-381 
函数 定义 , 380 
SIG2STR MAX 常量 ,380 
SIGABRT 信号 , 236, 240~241, 275, 313, 317~319, 365-367, 
381,924 
sigaction AM, 59, 323, 326, 329—331, 333, 335-336, 
349—355, 366, 370, 374, 376, 455, 468, 476, 478—479, 
510, 621, 815, 939 


802 索引 


函数 定义 , 350 
sigaction 结构 , 350, 354-355, 366, 369, 374, 376, 379, 
467, 476, 478, 621, 814 
sigaddset 函数 , 331, 344—345, 348, 360, 362-363, 370, 
374, 378, 456, 478-479, 701, 815, 933 
函数 定义 , 344—345 
SIGALRM 信和 号 , 313-314, 317, 330—332, 338~340, 342-343, 
347, 354, 356—357, 364—365, 373-374, 621 
sigaltstack MR, 351 
sig atomic t 数据 类 型 , 59, 356~357, 361—363, 732 
SIG BLOCK 常量 , 346, 348, 360, 362~363, 370, 374, 454, 
456, 477, 701, 815 
SIGBUS 信号, 317, 352-353, 527, 530 
SIGCANCEL 信号, 317 
SIGCHLD 信和 号, 238, 288, 315, 317, 331-335, 351-353, 
367-368, 370-371, 377, 471, 501, 546, 723, 923, 939 
semantics (XL) , 332-335 
SIGCLD 信号 , 317, 332-336 
SIGCONT 信号, 301, 309, 317, 337, 377, 379 
sigdelset 函数 ,331, 344—345, 366, 374, 933 
函数 定义 , 344-345 
SIG DFL 常量 , 323, 333, 350—351, 366, 378—379, 476 
sigemptyset MAT X, 331, 344, 348, 354-355, 360, 
362-363, 369—370, 374, 378, 456, 467, 476, 478, 621, 
701, 815, 933 
函数 定义 , 344 
SIGEMT 信号 , 317~318 
SIG ERR # Æ, 19, 324, 334, 340~343, 348, 354~356, 
360~361, 363, 368, 550, 709, 711, 733 
sigevent 444, 512 
SIGEV NONE 常量 , 518 
sigfillset AM, 331, 344, 366, 477, 933 
BE X, 344 
SIGFPE 信和 号, 18, 240-241, 317-318, 352-353 
SIGFREEZE 信号 , 317~318 
Sigfunc 数据 类 型 , 354—355, 896 
SIGHUP 信号 , 308-309, 317-318, 468, 475-479, 546, 815, 
830, 843 
SIG IGN 常量 , 323, 333, 350, 366, 369, 379, 467, 815 
SIGILL 信号 , 317~318, 351-353, 366 
SIGINFO 信号 , 317~318, 682, 689 
siginfo 结构 , 244, 283, 351—352, 376, 379, 381, 512 
SIGINT 信号, 18-19, 300, 314, 317, 319—320, 340—341, 347, 
359—361, 364—365, 367-370, 372, 455-451, 546, 679, 
681, 685, 688-689, 701—702, 709, 930, 932 
SIGIO 信和 号, 83, 317, 319, 501, 509—510, 627 
SIGIOT 信和 号, 317, 319, 365 


sigismember AR, 331, 344—345, 347~348, 933 
函数 定义 , 344-345 
sigjmp buf 数据 类 型 , 356 
SIGJVM1 和 信号, 317 
SIGJVM2 信号 , 317 
SIGKILL 信号 , 272, 275, 315, 317, 319, 321, 323, 346, 380, 
735 
siglongjmp 函数 ,219, 331, 355-358, 365 
eR E X, 356 
SIGLOST fi 8,317 
SIGLWP 信号, 317, 319, 321 
signal MRM, 18-19, 59, 308, 323—326, 329—335, 339—343, 
348—349, 354—356, 360—361, 363, 368, 378, 510, 550, 
709, 711, 939 
HRE X, 323, 354 
signal mask (fa SBR) , 336 
signal set 《信号 集 ) , 336, 344~345, 532, 933 
<signal .h> 头 文件 , 27, 240, 314, 324, 344—345, 380 
signal intr AR, 330, 355, 364, 382, 508, 733, 896, 930 
函数 定义 , 355 
signals (4& 9) , 18-19, 313-382 
blocking (fa 5 HE) , 335 
delivery (fA 9 X535) , 335 
generation 《信和 号 产生 〉, 335 
generation, pseudo terminal 〈 擅 终端 信号 产生 ) ,741 
job-control (作业 控制 信和 叶 ) , 377~379 
null (null 信和 号) , 314, 337 
pending 〈 未 决 信号 》 , 335 
queueing 〈 信 号 排队 ) , 336, 349, 376 
reliable (可 靠 信号 ) , 335-336 
unreliable (不 可 靠 信和 号) , 326-327 
signal thread MA, 814, 830 
函数 定义 , 830 
sigpause 函数 , 331 
sigpending MR, 331, 335, 347—349 
函数 定义 , 347 
SIGPIPE 信号 , 314, 317, 319, 537, 550—551, 553, 556, 587, 
611, 815, 936 
SIGPOLL 信号 , 317, 319, 501, 509—510 
sigprocmask 函数 , 331, 336, 340, 344, 346—349, 360, 
362—364, 366, 370, 374, 378, 453-454, 456, 701 
函数 定义 , 346 
SIGPROF 信号 , 317, 320 
SIGPWR 信号 , 317~318, 320 
sigqueue AR, 222, 331, 353, 376-377 
函数 定义 ,376 
SIGQUEUE MAX 常量 , 40, 43, 376 


SIGQUIT 信号 , 300, 317, 320, 347-349, 361—362, 367, 370, 
372, 456-457, 546, 681, 689, 702, 709 
SIGRTMAX 常量 , 376 
SIGRTMIN 常量 , 376 
SIGSEGV 信号 , 314, 317, 320, 332, 336, 352-353, 393, 527 
sigset MA, 331, 333 
sigsetjmp 函数 ,219, 331, 355—358 
函数 定义 , 356 
SIG_SETMASK 常量 , 346, 348—349, 360, 362—364, 366, 370, 
374, 454, 456, 701 
sigset t 数据 类 型 , 59, 336, 344, 347-348, 360-361, 363, 
366, 369, 374, 378, 454—456, 701, 813 
SIGSTKFLT 信和 号, 317, 320 
SIGSTOP 信号 , 315, 317, 320, 323, 346, 377 
SIGSUSP 信号 , 689 
sigsuspend 函数 , 331, 340, 359-365, 374, 451 
函数 定义 , 359 
SIGSYS 信和 号, 317, 320 
SIGTERM 信号 , 315, 317, 321, 325, 476~479, 709, 732—733, 
742, 815, 830, 944 
SIGTHAW 信号 , 317, 321 
SIGTHR 信号 , 319 
sigtimedwait 函数 ,451 
SIGTRAP 信号 , 317, 321, 351, 353 
SIGTSTP 信号 , 300, 308, 317, 320-321, 377—379, 680, 682, 
701, 735 
SIGTTIN 信号 , 300—301, 304, 309, 317, 321, 377, 379 
SIGTTOU 信和 号, 301—302, 317, 321, 377, 379, 691 
SIG UNBLOCK 常量 , 346, 349, 378, 454 
SIGURG 信号 , 83, 314, 317, 319, 322, 510—511, 626 
SIGUSR1 fÈ, 317, 322, 324, 347, 356—358, 360-361, 
363—364, 501 
SIGUSR2 信号 , 317, 322, 324, 363—364 
sigval 结构 , 352 
SIGVTALRM 信号 , 317, 322 
sigwait MR, 451, 454—455, 457, 475, 477, 830 
函数 定义 , 454 
sigwaitinfo HX, 451 
SIGWAITING fi 9,317, 322 
SIGWINCH 信 €, 311, 317, 322, 710-712, 718-719, 
741—742 
SIGXCPU 信和 号, 221, 317, 322 
SIGXFSZ 信号 , 221, 317, 322, 382, 925 
SIGXRES 信号 , 317, 322 
Silicon Graphics, Inc., 见 SGI 
SI MESGQ 常量 , 353 
Singh, A., 112, 116, 952 
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Single UNIX Specification, J SUS 
Version 3， 见 SUSv3 
Version 4, Ul, SUSv4 
single-instance daemons《 单 实例 守护 进程 ), 473—474 
S_INPUT 常量 , 510 
SIOCSPGRP 常量 , 627 
SI QUEUE 常量 , 353 
S IRGRP 常量 , 99, 104, 107, 140, 149, 473, 896 
S IROTH 常量 , 99, 104, 107, 140, 149, 473, 896 
S IRUSR 常量 , 99, 104, 107, 140, 149, 169, 473, 818, 896 
S IRWXG 常 最 , 107, 639 
S IRWXO 常量 , 107, 639 
S IRWXU 常量 , 107, 584, 639 
S ISBLK 函数 , 96-97, 139 
S ISCHR PAR, 96-97, 139, 698 
S ISDIR 函数 , 96-97, 133, 698 
S ISFIFO BR, 96~97, 535, 552 
S ISGID 常量 , 99, 107, 140, 498 
S ISLNK 函数 , 96-97 
S ISREG 函数 , 96, 808 
S ISSOCK 函数 , 96-97, 639 
S ISUID 常量 , 99, 107, 140 
S ISVTX 常量 , 107~109, 140 
SI TIMER 常量 , 353 
SI USER 常量 , 353 
S IWGRP 常量 , 99, 104, 107, 140, 149 
S IWOTH 常量 , 99, 104, 107, 140, 149 
S IWUSR 常量 , 99, 104, 107, 140, 149, 169, 473, 818, 896 
S IXGRP 常量 , 99, 107, 140, 498, 896 
S IXOTH 常量 , 99, 107, 140, 896 
S IXUSR 常量 , 99, 107, 140, 169, 896 
size, file〈 文 件 大 小 ) ,111~112 
size 程序 , 206-207, 226 
sizeof 操作 符 , 231 
size_t 数据 类 型 , 59-60, 71, 507, 772, 906 
. SLBF 常量 , 166 
sleep 函数 , 230, 234, 243, 246, 272, 274, 308, 331, 334, 
339—342, 348, 372-375, 381-382, 387, 391—392, 439, 
451, 460, 504, 532, 606—607, 923, 925, 928, 931, 936 
函数 定义 , 373-374, 929 
sleep 程序 , 372 
sleep2 iXX, 924 
sleep us 函数 , 532, 896 
函数 定义 , 933-934 
SMF (Service Management Facility， 服 务 管理 设施 ) , 293 
S MSG 常量 , 510 
. SNBF 常量 , 165 
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snprintf AR, 159, 901, 904 
函数 定义 , 159 
Snyder, G., 951 
sockaddr 结构 ，595~597, 605—607, 609, 622, 625, 635, 
637, 639, 641, 800 
sockaddr in 结构 , 595-596, 603 
sockaddr in6 结构 , 595-596 
sockaddr un 结构 , 634~638, 640-642 
sockatmark PAR, 331, 626 
RAGE X, 626 
SOCK DGRAM 常量 , 590—591, 602, 608, 612, 621, 623, 632, 
941 
socket 
addressing (ERF RE) , 593-605 
descriptors《 套 接 字 描 述 符 ) , 590-593 
I/O, asynchronous (Eb SERE. VO) , 627 
I/O, nonblocking ( 非 阻塞 套 接 字 VO) , 608-609, 627 
mechanism (EFL) , 95, 534, 587, 589-628 
options〈 套 接 字 选项 ) , 623~625 
socket MA, 148, 331, 590, 592, 607, 609, 621, 625, 
637~638, 640—641, 808 
函数 定义 , 590 
socketpair 函数 , 148, 331, 629—630, 632, 634, 941 
函数 定义 , 630 
sockets, UNIX domain (UNIX 域 套 接 字 ) , 629—642 
timing〈 套 接 字 时 间 ) , 565 
socklen 上 数据 类 型 , 606~607, 609, 622, 625, 800 
SOCK_RAW 常量 , 590~591, 602 
SOCK SEQPACKET 常量 , 590~591, 602, 605, 609, 612, 625 
SOCK STREAM 常量 , 319, 590~591, 602, 605, 609, 612, 
614—616, 618—619, 625, 630, 635, 637, 640, 802, 808, 
816 
Solaris , 3-4, 26-27, 29~30, 35-36, 38, 41, 48-49, 57-60, 62, 
64~65, 70, 76, 88, 102, 108-113, 121-122, 129, 
131-132, 138, 178, 182, 184—188, 208-209, 211-212, 
222, 225, 229, 240, 242, 244—245, 260, 277, 288, 290, 
293, 296, 298, 303, 314, 316—323, 329, 334—335, 351, 
355, 371, 373, 377, 379—380, 385, 388, 392, 396, 409, 
426-427, 432, 439, 471, 485, 496-497, 499, 503, 
530—531, 534, 559, 561, 563, 565, 567, 572-573, 576, 
592, 594, 607—608, 611-613, 627, 634, 648, 675—678, 
684—691, 693, 700, 704, 716—717, 723—724, 726—727, 
740-741, 744, 799, 911, 918, 925, 930, 932, 935-936, 
951 
SOL SOCKET 常量 , 624~625, 645—646, 650—652 
solutions to exercises 《习题 解答 ) , 905-945 
SOMAXCONN 常量 , 608 


SO OOBINLINE 常量 , 626 
SO PASSCRED 常量 , 651 
SO REUSEADDR 常量 , 625 
S OUTPUT 常量 , 510 
Spafford, G., 181, 250, 298, 949 
spawn 函数 , 234 
«spawn.h»3k IIF, 30 
spin locks ( WEB) ,417~418 
spooling, printer《〈 打 印 机 假 脱 机 》, 793~795 
sprintf 函数 ，1$9，549，616，622，640，655，657，659， 
668-669, 759, 772—773, 803, 818-819, 822-823, 
825—827, 833-835, 837, 845, 945 
函数 定义 , 159 
spwd 结构 , 918 
squid login name (squid 登录 名 ) ,178 
S RDBAND 常量 , 510 
S RDNORM 常量 , 510 
sscanf MA, 162, 549, 551, 802~803 
函数 定义 , 162 
ssh 程序 , 293 
sshd 程序 , 465 
SSIZE MAX 常量 , 38, 41, 71 
ssize t 数据 类 型 , 39, 59, 71 
stack (f£) ,205,215 
stackaddr 属性 , 427 
stacksize 属性 , 427 
standard error 《标准 错误 ) ,8, 145, 617 
standard error routines 〈 标 准 错误 例 程 ) , 898-904 
standard input 《标准 输入 ) , 8, 145 
standard LO 
alternatives〈 标 准 LO 替代 方案 ) , 174~175 
buffering 〈 带 缓冲 的 标准 VOD , 145~147, 231, 235, 265, 
367, 552, 721, 752 
efficiency 《标准 IO 效率 ) , 153-156 
implementation (RYE MO 实现 ) , 164—167 
library (标准 VO FE) , 10, 143~175 
streams (标准 WO JI.) , 143~144 
versus unbuffered I/O, timing( 标 准 VO 与 不 带 缓冲 的 VO 
的 时 间 比 较 ), 155 
standard output 《标准 输出 〉, 8, 145, 617 
standards (标准 〉, 25-33 
differences (标准 差异 〉, 58-59 
START terminal character (START 终端 字符 ) , 678, 
680—682, 686, 689, 693 
stat AR, 4, 7, 65, 93-95, 97, 99, 107, 121—122, 124, 
126-128, 131, 138, 140—141, 170, 331, 452, 586, 592, 
628, 639—640, 670, 698, 908, 910, 942 
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函数 定义 , 93 
stat 结构 , 93-96, 98, 111, 114, 124, 140, 147, 167, 170, 
498, 518, 529, 535, 552, 557, 586, 638, 697-698, 757, 
807, 832 
static variables 《静态 变量 ) , 219 
STATUS terminal character (STATUS 终止 符 ) , 678, 682, 
687, 689, 703 
«stdarg.h»3 X ftf, 27, 162-163, 755, 758 
<stdbool .h> 头 文件 ,27 
__STDC_IEC 559 常量 , 31 
<stddef,h> 头 文件 , 27, 635 
stderr 变量 , 145, 483, 731, 901 
STDERR FILENO 常量 ，62，145，618~619，643，648， 
652, 729 
stdin 变量 , 10, 145, 154, 214, 216, 550—551, 654 
STDIN FILENO 常量 , 9, 62, 67, 72, 145, 308, 378, 483, 539, 
544, 549—550, 619, 655—656, 679, 684, 709, 711, 728, 
730-732, 739—740 
«stdint.h»3k X ff, 27, 595 
«stdio.h»3k X fF, 10, 27, 38, 51, 145, 147, 151, 164, 168, 
694, 755, 895 
«stdlib.h»3. X fF, 27, 208, 895 
stdout 变量 , 10, 145, 154, 247-248, 275, 901, 921, 930 
STDOUT FILENO 常量 , 9, 62, 72, 145, 230, 235, 378, 483, 
537, 544, 549—550, 614, 618-620, 654—656, 729, 733, 
739-740, 921 
Stevens, W. R., 157, 291, 470, 505, 589, 717, 793, 952 
sticky bit ($Æ fz) , 107-109, 117, 140 
stime 函数 , 190 
Stonebraker, M. R., 743, 953 
STOP terminal character (STOP 终端 字符 ) , 678, 680—682, 
686, 689, 693 
str2sig MR, 380 
函数 定义 ,380 
strace 程序 , 497 
Strang, J., 712, 953 
strchr 函数 , 767 
stream orientation 《〈 流 方向 ) , 144 
STREAM MAX 常量 , 38, 40, 43, 49 
STREAMS , 88, 143, 501—502, 506, 508, 510, 534, 560, 565, 
648, 716—717, 722, 726, 740 
streams, memory 《内 存 流 ) , 171-174 
STREAMS module 
ldterm, 716, 726 
pckt, 716, 740 
ptem, 716, 726 
ttcompat, 716, 726 


streams, standard VO ($x? IO W) , 143—144 
STREAMS-based pipes, mounted (装配 的 基于 STREAMS 
的 管道 ) , 534 
timing (iE , 565 
strerror MM, 15-16, 24, 380, 442, 452, 471, 474, 
478—479, 600, 615-618, 621—622, 657, 669, 823—827, 
830, 833—834, 842, 899, 901, 904, 906, 931 
函数 定义 , 15 
strerror r RM, 443, 452 
strftime AR, 190, 192~196, 264, 408, 452, 919 
函数 定义 , 192 
strftimel 函数 , 192 
PARLE KM, 192 
«string.h»3X Xf, 27, 895 
<strings.h> 头 文件 , 29 
strip 程序 , 920 
strlen AX, 12, 231, 945 
strncasecmp AR, 840 
strncpy BR, 809 
Strong, H. R., 744, 750, 949 
«stropts.h»3ikX ft, 508, 510 
strptime 函数 , 195 
函数 定义 , 195 
strsignal MR, 380, 830 
函数 定义 , 380 
strtok PR, 442, 657-658 
strtok r 函数 , 443 
strtol AX, 633 
stty 程序 , 301, 691~692, 702, 713, 943 
Stumm, M., 174, 531,950 
S TYPEISMQ 函数 , 96 
S TYPEISSEM 函数 , 96 
S TYPEISSHM 函数 , 96 
su 程序 , 472 
submit file 函数 , 807, 809,811 
函数 定义 , 809 
SUID, A set-user-ID 
Sun Microsystems, 33, 35, 76, 740, 953 
SunOS, 33, 206, 330, 354 
superuser 《超级 用 户 ), 16 
supplementary group ID 《附属 组 ID) , 18, 39, 98, 101, 108, 
110, 183—184, 233, 252, 258 
SUS (Single UNIX Specification ) , 28, 30-33, 36, 50, 53-54, 
57-58, 60—61, 64, 69, 78, 88, 94, 105, 107, 109, 131, 
136, 143, 157, 163, 168—169, 180, 183, 190-191, 196, 
211-212, 220-221, 234, 239, 244—245, 262, 293, 296, 
311, 315, 322, 330, 333, 352, 354, 410, 425, 429-431, 
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442, 469—472, 485, 496, 501, 507, 509, 521, 527--528, 
533—534, 559, 561, 565—566, 572—573, 583, 596, 607, 
610, 612, 623, 627, 645, 662, 674, 678, 683, 722-724, 
744, 910, 950, 953 
SUSP terminal character (SUSP 终端 字符 ) , 678, 680, 682, 
688, 701 
SUSv3 (Single UNIX Specification, Version 3) , 32 
SUSv4 (Single UNIX Specification, Version 4), 32, 88, 132, 
143, 153, 168-169, 189, 314, 319-320, 336, 375—376, 
384, 442, 501, 509—510, 525, 533, 571, 579 
SVID (System V Interface Definition) , 32~33, 948 
SVR2 , 65, 187, 317, 329, 336, 340—341, 712, 948 
SVR3 , 76, 129, 201, 299, 313, 317, 319, 326, 329, 333, 336, 
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SVR3.2, 36, 81, 267 
SVR4 , 3, 21, 33, 35-36, 48, 63, 65, 76, 121, 187, 209, 290, 
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507—508, 521, 712, 722, 744, 948, 953 
swapper process〈 交 换 进 程 ) , 227 
S WRBAND 常量 , 510 
S WRNORM 常量 , 510 
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«sys/select.h»3k X ff, 29, 501, 504, 932~933 
<sys/sem.h> X. ft, 30, 568 
<sys/shm.h> 头 文件 ,30 
sys siglist 变量 , 379 
<sys/signal.h> 头 文件 , 314 
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函数 定义 , 126 
UTIME OMIT 常量 , 126-127 
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waitid BRM, 244-245, 283, 451 
KRE X, 244 

WAIT PARENT 函数 , 247—248, 362, 491, 498, 532, 539, 

577, 898 
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writen RRM, 523-524, 644, 732—733, 738, 810-811, 
824—827, 836, 896 
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